min: EEB EVE Mer 


PRENTICE 


The Standard C Library 
C 标 淮 库 


[ 美 ] P.J.Plauger 著 
卢 红 星 徐 明亮 EBA F 


8 C 标 准 库 “圣经 ” 
8 提供 完整 源 代码 ， 全 面 深 入 阐述 库 函 数 的 实现 与 运用 
8 C 程 序 员 必 备 参 考 书 


BAB 人民 邮 电 出 版 社 
G POSTS & TELECOM PRESS 


AE ERRA (CIP) 数据 


` C 标准 库 / (ED 普 劳 格 (Plauger, P.J.) 4; FAE, 
徐 明亮 ， 堆 建 同 译 .一 北京 ， 人 民 邮 电 出 版 社 ，2009.7 
(图 灵 程 序 设 计 从 书 》 
ISBN 978-7-115-17286-0 


LC: TOR OP Mk DE» TOR — 
序 设计 IV.TP312 


中 国 版 本 图 书馆 CP 数据 核 字 《2007) 第 187460 号 


内 容 提 要 


本 书 集中 讨论 了 C 标准 库 ， 全 面 介绍 了 ANSIISO C 语言 标准 的 所 有 库 函 数 。 书 中 通过 引用 ISO C 标 
准 的 相关 部 分 ， 详 细 讲 解 了 每 一 个 库 函 数 的 使 用 方法 ， 并 通过 示例 描述 了 其 实现 细节 ， 且 给 出 了 实现 和 测 
试 这 些 函 数 的 完整 代码 。 此 外 ， 每 章 结尾 附 有 不 同 难度 的 习题 ， 帮 助 读者 巩固 和 提高 。 通 过 此 书 ， 读 者 将 
会 更 好 地 使 用 C 标准 库 ， 并 学 会 如 何 设 计 和 实现 库 。 

本 书 结构 清晰 , 内 容 权 威 , 阐述 精辟 , 对 于 各 层次 C 程序 员 和 相关 专业 高 校 师 生 都 是 一 本 优秀 的 参考 书 。 
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Æ A FF 


理论 上 ， 在 学 习 完 任何 编程 语言 的 基本 语法 后 ， 我 们 就 可 以 用 它 来 编写 程序 以 解决 任何 实 
际 的 问题 了 。 但 是 ， 熟 练 地 使 用 语言 中 已 经 提供 的 代码 库 有 助 于 我 们 在 编程 时 极 大 地 减少 工作 
量 和 避免 不 必要 的 错误 。 语 言 所 衍生 出 的 任何 能 提高 生产 力 的 库 ， 其 重要 性 往往 会 远 远 超 过 该 
语言 本 身 。 对 这 些 库 的 了 解 程度 ， 也 是 评判 一 位 优秀 程序 员 的 重要 标准 。 因 此 ， 学 习 一 门 语言 
并 学 习 其 库 的 实现 ， 这 样 才能 熟练 地 驾驭 语言 工具 ， 了 人 解 库 所 提供 的 功能 和 局 限 性 ， 进 而 在 特 
定 的 应 用 要 求 下 扩展 库 一 一 这 往往 是 初学 者 普遍 忽视 的 一 个 重要 细节 。 


C 语言 更 是 如 此 ! 尽管 它 及 它 所 附带 的 C BREE PRE KS EPA NE, [HH C 语言 
写 的 程序 却 已 深入 到 软件 行业 的 各 个 关键 角落 ， 使 我 们 不 得 不 要 花 大 力气 “过 分 ”地 钻研 它 。 
已 经 有 太 多 的 书 关注 了 C 语言 本 身 及 C 标准 库 应 如 何 使 用 ， 本 书 却 独树一帜 ， 它 将 告诉 你 C 标 
准 库 是 如 何 用 标准 C 来 实现 的 。 学 习 C 标准 库 本 身 的 实现 ， 就 是 学 习 C 语言 最 好 的 教材 ， 因 为 
其 实现 过 程 将 会 把 使 用 C 语言 编写 具有 工业 强度 的 健壮 代码 所 需 的 技巧 展现 得 淋漓尽致 。 


如 果 想 仔细 探究 C 标准 库 的 实现 细节 ，P J. Plauger 的 这 本 书 将 是 你 最 好 的 选择 了 ?。C 标准 
库 由 在 15 个 头 文件 中 声明 的 函数 、 类 型 定义 和 宏 组 成 ， 每 个 头 文件 或 多 或 少 代表 了 一 定 范围 的 
编程 功能 。 有 人 说 ， 标 准 库 可 以 分 为 3 组 ， 如 何 正确 和 熟练 地 使 用 它们 ， 可 以 相应 地 区 分 出 3 
种 层次 的 C 程序 员 : 


O 218255, <ctype.h>, <stdio.h>, <stdlib.h>, <string.h>; 
C) JAHJA, <assert.h>, <limits.h>, <stddef.h>, «time.h»; 
O ARFA, <float.h>, <math.h>, <error.h>, <locale.h>, <setjmp.h>, 


«signal.h», «stdarg.h», 


如 果 你 反复 研读 本 书 ， 并 能 将 本 书 所 提供 的 9 000 余 行 关键 实现 代码 中 所 蕴藏 的 C 语言 
押 熟 答 地 应 用 到 你 正 要 或 将 要 从 事 的 实际 开发 中 去 ， 那 么 ， 毫 无 疑问 ， 你 已 完全 超越 了 上 面 
“优秀 程序 员 ” 的 标准 ， 成 为 “ 超 优秀 程序 员 ”! 


希望 这 本 令 我 在 翻译 过 程 中 获 益 菲 浅 的 书 也 能 给 你 带 来 美妙 而 独一无二 的 阅读 享受 ! 
最 后 ， 感 谢 人 民 邮 电 出 版 社 图 灵 公司 刘 江 和 傅 志 红 编辑 的 邀请 和 信任 ， 他 们 踏实 负责 、 


(D P. J. Plauger & 5 f C 和 C++ 标准 库 的 开发 ， 也 是 The Standard C++ Library 一 书 的 作者 。 一 一 译 者 注 
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MOV NV BS (IERT, SSES), WESS TAGES TMS PIPER 
整理 工作 ;感谢 郑州 大 学 的 卢 红星 老师 认真 审阅 和 复 译 全 稿 ， 他 深厚 的 技术 积淀 、 丰 富 的 教学 
经 验 以 及 一 丝 不 苟 、 精 益 求 精 的 严谨 态度 也 令 我 在 翻译 过 程 中 获 益 良 多 ; 更 要 感谢 我 的 妻子 徐 
静 ， 谢 谢 你 的 爱 。 由 于 译 者 经 验 和 水 平 有 限 ， 译 文 难免 有 不 受 之 处 ， 敬 请 读者 指正 并 与 我 交 
Wi: develop_game@yahoo.com.cn. 


ART 


本 书 将 告诉 你 如 何 使 用 符合 C 语言 的 ANSUISO 标准 的 库 函 数 。 因 为 已 经 有 很 多 书 出 色 地 
讲解 了 C 语言 本 身 ， 所 以 本 书 只 专注 于 “ 库 ” 这 个 话题 。 本 书 还 会 告诉 你 C 标准 库 是 如 何 实现 
的 。 本 书 提供 了 大 约 9 000 行 测试 过 的 可 实际 工作 的 代码 。 我 相信 ， 看 了 C 标准 库 的 实现 细节 
后 你 能 更 好 地 理解 如 何 使 用 它 。 


库 函 数 的 实现 代码 尽 可 能 地 使 用 标准 C， 这 样 做 有 3 个 设计 目的 : 首先 ， 它 使 代码 具有 可 
读 性 和 示范 性 ， 其 次 ， 它 使 代码 在 各 种 计算 机 体系 结构 间 具 有 高 度 可 移植 性 ， 最 后 ， 它 能 使 编 
写 的 代码 兼顾 正确 性 、 性 能 和 规模 各 方面 。 


教 你 如 何 编写 C 程序 并 不 是 本 书 的 目的 。 本 书 假定 你 能 读 懂 简单 的 C 程序 ， 对 于 那些 稍 有 
难度 的 代码 ， 我 会 向 你 解释 其 中 的 难点 和 技巧 。 


C 标准 库 
C 标准 库 是 非常 强大 的 ， 它 在 多 种 不 同 的 环境 下 提供 了 相当 多 的 功能 它 允 许 用 户 和 实现 


者 使 用 明确 定义 的 名 字 空 间 ， 它 对 其 所 提供 的 数学 函数 的 健壮 性 和 精确 性 有 非常 严格 的 要 求 ; 
它 率先 对 适应 不 同文 化 习惯 的 代码 提供 支持 ， 包 括 那 些 拥有 很 大 字符 集 的 文化 习惯 。 


为 了 能 有 效 利用 标准 库 所 提供 的 强大 功能 ， 用 户 应 该 了 解 其 实现 上 的 很 多 隐 腹 细 节 。 库 的 
实现 者 必须 向 用 户 提供 这 些 细节 ， 以 使 他 们 更 好 地 使 用 标准 库 。C 标准 中 并 没有 把 这 些 隐 唾 的 
实现 细节 都 很 好 地 描述 清楚 ， 因 为 制定 标准 的 主要 目的 并 不 是 给 库 的 实现 者 提供 指导 。 与 ANSI 
C 标准 一 起 发 布 的 Rationale 也 没有 对 这 些 细节 作出 很 好 的 解释 。Rationale 要 服务 的 对 象 范围 很 
广 ， 而 关注 这 些 细节 的 标准 实现 者 只 是 众多 服务 对 象 的 一 部 分 。 


在 C 的 传统 实现 中 并 不 能 找到 上 面 提 到 的 新 特性 。 现 在 的 实现 已 经 可 以 支持 国际 化 开发 
中 的 区 域 设置 (locale) 概念 。 每 个 区 域 设置 都 对 应 于 专属 的 某 个 国家 、 某 种 语言 或 者 某 个 职 
业 的 特定 习惯 ， 一 个 C 程序 可 以 通过 修改 和 查询 区 域 设 置 来 动态 地 适应 多 种 文化 。 现 在 的 实现 
也 能 支持 很 大 的 字符 集 ， 如 字符 数量 众多 的 汉字 。C 程序 能 把 它们 作为 多 字 节 字符 《〈multibyte 
character) 或 者 宽 字 节 字 符 (wide character) 处 理 。 它 也 能 在 这 两 种 形式 之 间 转 换 。 在 迅速 加 剧 | 
的 市 场 竞 争 中 ， 这 就 使 得 程序 的 编写 更 加 简单 和 标准 。 


因为 以 前 对 这 些 新 特性 几乎 不 存在 相应 的 编程 艺术 ， 所 以 即使 是 最 有 经 验 的 C 程序 员 ， 在 
使 用 区 域 设置 、 多 字 节 字符 和 宽 字 节 字 符 的 时 候 也 需要 一 些 指 导 。 所 以 ， 这 些 主题 在 这 里 给 予 


了 特殊 的 关注 。 
细节 
本 书 向 用 户 和 实现 者 解释 了 库 的 设计 用 意 和 可 能 用 法 。 通 过 提供 C 标准 库 中 所 有 库 函 数 的 


实际 实现 ， 本 书 用 例子 告诉 你 怎样 处 理 它 的 细节 。 在 那些 没有 明确 是 最 好 实现 方法 的 地 方 ， 它 
还 讨论 了 可 供 选择 和 折 中 的 办 法 。 


一 个 涉及 细节 的 例子 是 函数 getchar。 头 文件 <stdio.h> 原则 上 可 以 用 下 面 的 宏 来 屏 项 函 
数 的 声明 ， 


#define getchar() fgetc(stdin) /* NOT WISE! */ 


然而 ， 它 却 不 应 该 这 样 做 ， 一 个 合理 (即使 没有 用 ) 的 C 程序 是 : 
#include <stdio.h> 


#undef fgetc 


int main(void) ( 
int fgetc = getchar(); /* PRODUCES A MYSTERIOUS ERROR */ 


return (0); 


) 


当然 ， 这 个 例子 有 点 极端 但 它 却 阐述 了 即使 是 一 个 很 好 的 程序 员 也 可 能 犯 的 错误 。 用 户 
有 权 要 求 尽 可 能 少 地 出 现 这 类 奇怪 的 错误 ， 所 以 设计 者 就 有 义务 避免 出 现 这 些 奇 怪 的 错误 。 


我 最 终 确定 的 getchar ZEE X: 
#define getchar () ( Files[0]-> Next < Files[0]-> Rend \ 
? * Files[0]-> Next++ : (getchar) ()) 

它 和 上 面 第 一 次 给 出 的 那个 显而易见 〈 而 且 更 具 可 读 性 ) 的 形式 大 不 相同 。 第 12 章 会 解释 其 中 
的 原因 。 
库 的 设计 

本 书 还 有 一 个 目的 ， 那 就 是 从 一 般 角度 教授 程序 员 怎 样 设计 和 实现 库 。 从 本 质 上 讲 ， 程 序 
设计 语言 提供 的 库 是 一 个 混合 的 “袋子 ”” 库 的 实现 者 要 具备 非常 广泛 的 技巧 才能 处 理 这 个 “ 袋 
子 ” 中 各 种 各 样 的 内 容 。 仅 仅 是 一 个 有 能 力 的 数值 分 析 员 ， 或 者 能 熟练 高 效 地 操作 字符 串 ， 或 


者 懂得 很 多 操作 系统 接口 方面 的 知识 ， 都 是 不 够 的 。 编 写 库 不 仅 需要 具备 以 上 所 有 了 能力， 还 需 
要 掌握 更 多 的 知识 。 


已 经 有 很 多 好 书 告诉 你 怎样 编写 数学 函数 ， 也 有 很 多 书 专门 介绍 某 种 特定 用 途 的 库 。 这 些 
都 是 告诉 你 怎样 使 用 现 有 的 库 。 有 些 书 甚至 证 明 某 个 库 的 各 种 设计 方案 抉择 的 正确 性 。 很 少 有 
书 致力 于 告诉 读者 全 面 地 构建 一 个 库 要 求 具 备 的 技能 。 


可 复 用 性 


很 多 书 都 介绍 了 设计 和 实现 软件 的 一 般 性 原则 。 这 些 书 中 提 到 的 方法 有 结构 化 分 析 、 结 构 
化 设计 、 面 向 对 象 设计 和 结构 化 编程 等 。 这 些 书 中 的 大 部 分 例子 只 考虑 了 为 某 个 应 用 编写 的 程 
序 。 然 而 ， 这 些 原则 和 方法 也 同样 适用 于 可 复 用 的 库 的 实现 。 


但 可 复 用 性 的 目标 进一步 提高 了 要 求 。 从 结构 化 设计 的 角度 来 看 ， 如 果 一 个 库 函数 没有 很 
高 的 内 聚 性 ， 它 就 不 太 可 能 有 新 的 用 途 。 同 样 ， 如 果 它 不 具备 低 看 合 性 ， 它 就 会 更 难 使 用 。 简 
单 地 说 ， 库 函数 一 定 要 隐藏 它 的 实现 细节 并 且 提 供 完 整 的 功能 。 和 否则， 从 面向 对 象 的 角度 看 ， 
它们 不 能 实现 可 复 用 的 数据 抽象 。 


所 以 本 书 的 最 终 目的 是 讨论 构建 库 所 特有 的 设计 和 实现 问题 。C 标准 库 的 设计 是 固定 的 。 
然而 ， 它 从 很 多 方面 来 看 都 是 一 个 好 的 设计 ， 值 得 讨论 。C 标准 库 的 实现 也 可 以 有 很 多 选择 。 
任何 一 个 选择 都 要 遵守 一 定 的 原则 ， 例 如 正确 性 和 可 维护 性 等 。 其 他 的 一 些 选择 还 要 遵循 某 个 
项 目 特定 的 优先 级 ， 例 如 高 性 能 、 可 移植 性 或 者 小 规模 等 。 这 些 选 择 和 原则 也 值得 讨论 。 


本 书 的 结构 


本 书 的 结构 基本 对 应 C 标准 库 本 身 。 标 准 库 中 15 个 头 文件 声明 或 定义 了 库 中 所 有 的 名 字 。 
本 书 中 每 一 章 讲述 一 个 头 文件 。 大 部 分 头 文件 都 有 比较 紧 次 的 内 容 ， 书 中 对 此 也 作 了 紧凑 的 讨 
YE. 然而， 也 有 一 两 个 很 笼统 ， 它 们 相应 的 章节 自然 也 会 涉及 更 多 的 内 容 。 


在 本 书 的 每 一 章 中 ， 我 都 摘录 了 ISO C 标准 的 相关 部 分 。( 除 了 格式 细节 ，ISO 和 ANSI 的 
C 标准 是 完全 相同 的 . ) 这 些 摘录 补充 说 明了 库 的 每 一 部 分 通常 是 怎样 使 用 的 。 它 们 也 使 本 书 成 
为 一 个 更 完整 的 参考 手册 (当然 本 书 比 单独 阅读 C 标准 要 容易 理解 )。 本 书 也 给 出 了 实现 那些 部 
分 和 测试 这 些 实现 所 需 的 代码 。 


每 一 章 最 后 都 附 有 参考 文献 和 配套 习题 。 假 如 本 书 作 为 大 学 的 教材 使 用 ， 这 些 习题 可 以 当 
成 作业 。 很 多 习题 都 只 是 简单 的 代码 改写 ， 它 们 可 以 把 某 个 知识 点 讲 得 更 清楚 或 者 能 够 说 明 在 
实现 上 可 以 做 一 些 合理 的 修改 。 那 些 更 具有 挑战 性 的 题目 都 做 了 标记 ， 可 以 将 它们 作为 那些 长 
期 项 目的 基础 ， 而 自学 者 则 可 以 把 这 些 习 题 当 作 深 入 思考 的 入 口 点 。 


代码 


本 书 中 出 现 的 代码 已 经 在 Borland, GNU m HAI VAX ULTRIX 的 C 编译 器 上 进行 了 测试 。 
它 通 过 了 广泛 使 用 的 Plum Hall Validation Suite 的 库 函 数 的 测试 ， 也 通过 了 那些 专门 为 C 实现 设 
计 的 、 发 现 C 实现 的 缺陷 的 公共 域 程序 。 虽 然 我 尽 最 大 努力 使 错误 减 到 最 少 ， 但 仍然 不 能 保证 
代码 完全 正确 。 


同时 也 请 注意 本 书 的 代码 是 受 版 权 保 护 的 。 它 没有 放置 在 公共 域 中 ， 也 不 是 共享 软件 。 和 
那些 自由 软件 基金 会 GNU 项 目 ) 发 布 的 代码 不 同 ， 它 不 受 “copyleft” 协 议 的 保护 。 我 保留 
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本 书 所 有 的 权利 。 
合理 使 用 


你 可 以 把 书 中 的 代码 转变 为 电子 版 的 形式 ， 供 个 人 使 用 。 你 也 可 以 从 堪萨斯 州 劳伦斯 市 
的 C 用 户 组 那里 购买 机 器 可 识别 的 代码 。 无 论 哪 种 情况 ， 你 对 代码 的 使 用 都 要 遵守 版 权 法 关于 
“合理 使 用 ”的 规定 。 合 理 使 用 不 允许 你 以 任何 形式 发 布 这 些 代 码 的 副本 ， 不 论 是 打印 件 还 是 电 
子 版 ， 也 不 论 是 免费 的 还 是 收费 的 。 


除了 以 上 谈 到 的 ， 我 允许 合理 使 用 范围 之 外 的 一 种 重要 用 途 。 你 可 以 编译 库 中 的 部 分 并 
且 把 生成 的 二 进 制 目标 模块 和 你 自己 的 代码 连接 生成 可 执行 文件 。 无 限 发 布 这 样 的 可 执行 文件 
是 允许 的 。 对 这 样 的 副本 我 不 要 求 任 何 权 利 。 但 是 ， 我 强烈 要 求 你 声明 库 〈 在 你 的 文件 中 ) 的 
存在 ， 不 论 你 用 了 多 少 ， 也 不 论 是 修改 过 的 还 是 没有 修改 的 。 请 在 可 执行 文件 的 某 个 地 方 把 下 
面 的 文字 包含 进去 :“ 本 作品 的 部 分 代码 源 自 The Standard C Library, copyright (c) 1992 by P. J. 
Plauger, Prentice-Hall 出 版 社 出 版 ， 这 些 代 码 已 获 授 权 使 用 。” 随 可 执行 文件 一 同 发 布 的 文档 中 也 
要 在 适当 的 地 方 显 著 地 标注 这 些 内 容 。 如 果 你 遗漏 了 其 中 的 任何 内 容 ， 将 被 视 为 侵权 。 


许可 


你 也 可 以 被 授权 做 更 多 的 事 。 你 可 以 以 二 进 制 目标 模块 的 形式 发 布 整个 库 ， 甚 至 可 以 发 布 
本 书 中 的 源 文 件 的 副本 ， 不 论 是 否 修改 过 。 简 单 地 说 ， 你 可 以 把 整个 库 合 并 到 一 个 让 人 们 使 用 
它 来 编写 可 执行 程序 的 产品 中 。 但 是 ， 所 有 的 这 些 都 需要 许可 证 。 你 可 以 购买 许可 证 。 如 果 你 
想 购买 许可 证 而 且 想 不 断 地 获得 库 的 支持 ， 请 和 夏威夷 州 卡 姆 艾 拉 市 的 Plum Hall 公司 联系 。 


虽然 上 面 的 几 段 有 很 浓 的 商业 色彩 ， 但 我 的 主要 目的 不 是 推销 一 个 商业 产品 。 我 非常 信任 
C 标准 ， 也 已 经 很 努力 地 参与 了 它 的 制定 。 我 花 了 很 大 的 精力 制定 C 标准 库 规范 。 我 想 证 明 我 
们 创建 了 一 个 良好 的 语言 标准 。 编 写 这 个 实现 和 这 本 书 就 是 为 了 说 明 这 个 简单 但 很 重要 的 事实 。 
致谢 | 

马萨诸塞 州 韦 克 菲尔德 市 的 Compass 公司 在 本 书 还 没完 成 的 时 候 就 很 信任 我 。 他 们 是 我 的 
库 代 码 的 第 一 批 使 用 者 ， 他 们 帮助 我 测试 、 调 试 ， 并 且 在 Intel 860 编译 器 上 使 用 的 过 程 中 对 这 
些 库 代 码 进行 了 改进 。 特 别 是 lan Wells， 愿 意 忍受 我 的 延迟 和 修改 ， 体 现 了 他 和 良好 的 专业 精神 。 


Don Anderson 先生 为 了 使 这 个 库 的 结构 更 合理 ， 牺 牲 了 很 多 休息 时 间 给 我 发 电子 邮件 。 我 衷心 
地 感谢 Compass 公司 的 每 个 同事 的 真诚 和 耐心 。 


Prentice-Hall 的 出 版 人 Paul Becker 对 本 书 也 很 有 信心 。 他 的 温和 与 不 懈 的 激励 是 本 书 完成 
的 一 个 保证 。 他 请 了 一 些 匿 名 的 审 稿 人 帮助 我 ， 使 我 的 观点 更 加 明确 ， 同 时 也 减少 了 那些 绝对 
化 的 语句 。Paul 的 职业 精神 使 我 明白 了 Prentice-Hall 能 在 技术 出 版 领域 辉煌 这 人 么 多 年 的 原因 。 


写作 过 程 中 我 搬 到 了 澳大利亚 ， 这 个 项 目 面临 着 重重 困难 。 我 的 好 朋友 ， 澳 大 利 亚 White- 
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smiths 公司 的 商业 伙伴 John O'Brien 经 常 帮助 我 。 他 是 一 个 “把 荆棘 变 成 玫瑰 ”的 好 手 。 他 对 
我 的 帮助 很 大 ， 不 是 友谊 这 个 词 能 概括 的 。 


感谢 Prentice Hall 的 发 行经 理 Andrew Binnie 为 我 提供 了 完成 这 本 书 所 用 的 激光 打印 机 ， 他 
乐于 在 很 多 方面 帮助 我 。 感 谢 新 南 威尔士 大 学 计算 机 科学 系 给 我 提供 时 间 和 场所 ， 尽 管 他 们 也 
需要 这 些 来 完成 他 们 自己 的 计划 。 


Tom Plum 一 直 告 诫 我 们 要 深刻 理解 C 的 基础 。 我 也 多 次 从 和 他 对 本 书 中 涉及 的 话题 进行 的 
讨论 中 受益 菲 浅 。Dave Prosser 也 与 我 分 享 了 他 对 C 的 工作 方式 的 深刻 见解 。 作 为 ANSI 和 ISO 
C 标准 的 编辑 ，Dave 提供 了 本 书 中 大 量 电子 版 的 文本 资料 。 日 本 东京 的 高 级 数据 控制 公司 〈 率 
先 对 C 提供 日 文中 的 汉字 的 支持 ) 的 两 个 主要 负责 人 Hiroshi Fukutomi 和 Takashi Kawahara 在 
我 了 解 日 本 程序 员 的 技术 需求 的 工作 中 ， 给 了 我 很 多 帮助 。 

这 里 的 大 部 分 材料 原来 都 在 The C Users Journal 上 发 表 过 。Robert Ward 是 一 个 很 容易 相处 
的 出 版 人 ， 我 很 感谢 他 能 让 我 重新 使 用 这 些 材 料 。 也 同样 感谢 Jim Brodie 允许 我 使 用 我 们 合 著 
的 Standard C 一 书 中 的 内 容 。 

阅读 技术 类 书稿 是 一 项 很 枯燥 的 任务 。John O'Brien 和 Tom Plum 审阅 了 本 书 的 部 分 内 容 并 
且 反馈 了 很 有 价值 的 信息 。 发 现 第 一 次 印刷 版 本 中 《只 是 一 小 部 分 ) 错误 的 人 有 : Nelson H F. 
Beebe. Peter Chubb. Stephen D. Clamage. Steven Pemberton. Tom Plum 和 Ian Lance Taylor. 


最 后 ， 我 要 感谢 我 的 家 人 对 我 的 支持 。 我 的 儿子 Geoffrey 在 本 书 的 排版 和 页 面 设计 方面 做 
了 很 多 工作 。 我 的 妻子 Tana 在 这 么 长 的 时 间 里 给 我 提供 了 巨大 的 精神 支持 和 后 勤 保障 。 他 们 的 
参与 使 我 的 写作 过 程 充 满 乐趣 。 


P. J. Plauger 
Mik, HAARE 
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A (library) 是 一 个 可 以 在 许多 程序 中 复 用 的 程序 组 件 的 集合 。 大 部 分 
程序 设计 语言 都 包含 某 种 形式 的 库 ，C 语言 也 不 例外 。C 语言 从 一 开始 就 包 
含 许 多 有 用 的 函数 。 这 些 函 数 可 以 帮助 你 进行 字符 分 类 、 字 符 串 操作 、 读 输 
入 和 写 输出 等 一 一 这 里 只 举 出 了 一 些 类 别 的 服务 。 


在 程序 中 使 用 函数 之 前 ， 必 须 先 对 它 进行 声明 。 最 简单 的 方法 是 把 一 个 
头 文件 (header?) 包含 到 程序 中 ， 该 头 文件 声明 了 某 种 类 别 的 所 有 库 顶 数 。 
头 文 件 也 可 以 定义 任何 相关 的 类 型 定义 〈type definition) MÆ (macro). 3k 
文件 与 函数 本 身 都 是 库 的 组 成 部 分 。 在 大 多 数 情况 下 ， 与 构成 程序 的 源 代码 
一 样 ， 头 文件 也 是 文本 文件 〈text file). 


你 可 以 在 C 源 文件 中 使 用 预 处 理 指令 include 将 头 文件 变 为 翻译 单元 
(translation unit) 的 一 部 分 。 例 如 ， 头 文件 <stdio.h> 中 声明 了 一 些 完 成 输 
和 人 /输出 操作 的 函数 。 使 用 函数 printf 打印 一 条 简单 消息 的 程序 构成 了 下 面 
的 C 源 文 件 : 

/* a simple test program */ 


include <stdio.h> 


int main (void) 
{ /* say hello */ 
printf ("Hello\n"); 
return (0); 
} 
翻译 器 (translator) 把 每 一 个 翻译 单元 转换 成 一 个 目标 模块 ， 以 适用 于 
某 一 特定 的 计算 机 体系 结构 (或 机 器 )。 链 接 器 Clinker) 把 构成 整个 程序 的 所 
有 目标 模块 组 合 起 来 ， 它 也 将 用 到 的 、 来 自 C 语言 库 的 任何 目标 模块 包含 进 
去 。 编 译 器 (compiler) 是 最 常用 的 一 种 翻译 器 ， 它 将 源 文件 生成 一 个 可 执行 
文件 。 至 少 在 理想 情况 下 ， 一 个 可 执行 文件 中 只 有 包含 着 程序 实际 用 到 的 那 
些 消 数 的 库 所 生成 的 目标 模块 。 那样 ， 你 的 程序 就 不 会 随 着 C 语言 库 的 扩充 
而 增 大 。 解释 器 是 另 一 种 翻译 器 ， 它 可 能 把 整个 C 语言 库 都 包含 进来 ， 以 
解释 你 的 程序 。) 


2 $03 简 4r 
创建 库 你 可 以 构建 自己 的 库 。 典 型 的 C 编译 器 有 一 个 库 管 理 器 〈librarian)， 它 


用 C 编写 的 


C 语言 


可 以 将 你 所 指定 的 目标 模块 汇集 成 一 个 库 。 链 接 器 知道 如 何 从 任何 库 中 只 选 
取 程 序 所 用 到 的 目标 模块 。C 语言 库 并 没有 什么 特殊 的 。 
可 以 用 C 语言 编写 一 个 库 的 部 分 或 者 全 部 。 编 写 用 来 生成 库 的 目标 模块 
的 翻译 单元 也 没什么 特别 的 : 
O 库 的 目标 模块 不 应 该 包含 具有 外 部 连接 属性 的 main 函数 定义 。 程 序 
员 不 太 可 能 复 用 一 段 总 是 在 程序 启动 处 接管 控制 的 代码 。 
O 目标 模块 应 该 仅 包 括 那些 容易 声明 和 使 用 的 消 数 。 提 供 一 个 头 文件 ， 
该 文件 声明 了 这 些 函 数 且 定义 了 相关 的 类 型 和 宏 。 
D 最 重要 的 是 ， 库 的 目标 模块 应 该 在 各 种 上 下 文 环境 中 都 可 用 。 编 写 高 
度 可 复 用 代码 是 一 种 只 能 通过 实践 和 学 习 成 功 的 库 培养 出 来 的 技能 。 
读 完 本 书后 ， 你 将 能 用 C 语言 轻松 地 设计 、 构 建 和 编写 专用 的 库 。 
C 语言 库 本 身 就 是 用 C 语言 编写 的 ， 而 以 前 其 他 程序 设计 语言 的 库 实现 
就 往往 不 是 这 样 。 早 期 诸 言 的 库 是 用 汇编 语言 (assembly language) 实现 的 ， 
而 不 同 的 计算 机 体系 结构 有 不 同 的 汇编 语言 。 为 了 把 这 种 库 移 植 到 另 一 种 计 
算 机 体系 结构 下 ， 必 须 将 全 部 的 库 实 现 重 写 一 遍 。 使 用 C 语言 可 以 编写 出 具 
有 高 度 可 移植 性 的 健壮 且 高 效 的 代码 。 你 只 需 使 用 不 同 的 C 翻译 器 简单 地 翻 
译 一 下 CC 代码， 就 可 以 把 它 移植 到 另 一 种 机 器 上 。 
例如 ， 下 面 是 声明 在 <string.h> 头 文件 中 的 strlen RØA, TARA 
数 返回 一 个 以 空 字符 uD 结束 的 字符 串 的 长 度 ， 其 指针 参数 指向 字符 串 
的 第 一 个 元 素 : 


/* strlen function */ 
#include <string.h> 


size_t (strlen) (const char *s) 
{ /* find length of s[] */ 
const char *sc; 


for (sc = s; *sc !- 'N0'; ++sc) 


; 
return (SC - s) ; 


) 

strlen Æ— VARA 25 få ANKRE AR ES e YE ER] RO h 
strlen 的 应 用 很 广 。 你 也 许 想 为 一 个 指定 的 计算 机 体系 结构 提供 一 个 特定 的 
版 本 ， 但 实际 上 没有 必要 。 这 个 版 本 就 是 正确 的 、 可 移植 的 ， 而 且 效率 很 高 。 

很 多 其 他 的 现代 语言 都 不 能 用 来 编写 其 自身 语言 库 中 的 重要 部 分 。 例 
如 ， 你 不 能 用 可 移植 的 Pascal 实现 Pascal AYE RÅ wziteln。 但 是 ， 你 能 用 
可 移植 的 C 语言 实现 C MÆ RU printf。 这 种 对 比 有 点 不 公平 ， 因 为 C 的 
类 型 检查 没有 Pascal 那么 强 。 然 而 ， 这 一 点 非常 重要 一 一 C 语言 库 从 最 开始 
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不 可 移植 
的 代码 


就 几乎 完全 是 用 C 语言 来 表达 的 。 


有 些 库 冰 数 的 代码 不 能 用 可 移植 的 C 语言 编写 。 用 C 语言 编写 的 代码 也 
许可 以 在 很 多 种 计算 机 体系 结构 下 工作 ， 但 不 是 全 部 。 在 这 种 情况 下 ， 最 重 
要 的 是 要 清楚 地 将 那些 有 可 能 需要 修改 的 不 可 移植 部 分 记 人 。 你 也 应 该 尽 可 
能 把 不 可 移植 的 代码 独立 出 来 。 即 使 是 不 可 移植 的 C 代码 也 比 汇编 语言 更 容 
易 编 写 、 调 试 和 维护 。 应 该 只 在 某 些 不 可 避免 的 地 方 使 用 汇编 语言 ， 需 要 使 
用 汇编 的 地 方 在 C 库 中 极 少 出 现 。 

本 书 将 告诉 你 如 何 使 用 目前 的 、 标 准 化 形式 的 C 库 。 同 时 ， 也 会 告诉 你 
如 何 用 C 语言 编写 C 库 ， 这 有 助 于 你 理解 库 是 如 何 工作 的 。 本 书 也 将 从 多 方 
面 举例 说 明 如 何 用 C 设计 和 实现 一 个 优秀 的 库 。 


02 C 标准 的 内 容 


C 标准 


Dennis Ritchie 于 20 世纪 70 年 代 初 在 AT&T 贝尔 实验 室 开发 出 了 C 语 
言 的 最 初版 本 。 开 始 它 只 是 在 DEC PDP-11 计算 机 体系 结构 和 特定 的 UNIX 
系统 下 实现 的 语言 。 然 而 ， 很 快 有 人 发 现 ， 它 是 以 大 多 数 现 代 计 算 机 为 模型 
而 设计 的 。 到 20 世纪 70 年 代 末 ， 其 他 的 几 个 C 编译 器 作者 已 经 在 各 类 流行 
的 计算 机 上 实现 了 C 编译 器 的 不 同 版 本 ， 不 论 是 微型 机 还 是 大 型 机 。 到 20 
世纪 80 年 代 初 ， 数 以 百 计 的 C 编译 器 版 本 已 经 被 越 来 越 多 的 程序 员 社区 使 
用 。 这 时 ， 对 C 语言 进行 标准 化 的 时 候 到 了 。 


在 美国 ， 由 美国 国家 标准 化 协会 CANSD 对 程序 设计 语言 进行 标准 化 。 
X3J11 (经 ANSI 授权 的 制定 C 标准 的 委员 会 的 名 字 ) 始 于 1983 年 。 现 在 的 
语言 规范 是 ANSI 标准 X3.159-1989. ? 


与 之 类 似 ， 国 际 标准 化 组 织 〈ISO) 也 开始 在 国际 范围 内 制定 C 语言 标 
准 。ISO 成 立 了 JTC1/SC22/WG14 技术 委员 会 来 对 X3J11 的 工作 进行 审核 和 
补充 。 日 前 ，ISO 采用 了 一 个 本 质 上 与 X3.159 相同 的 标准 ISO 9899:1990. 
这 两 种 C 标准 只 是 在 格式 和 各 个 部 分 的 编号 上 略 有 不 同 ， 还 有 就 是 在 一 些 细 
节 地 方 使 用 不 同 的 措辞 ， 但 这 对 语言 标准 的 定义 并 没有 本 质 的 改变 。 

本 书 中 广泛 引用 了 ISO C 标准 。 这 样 你 就 能 准确 地 看 到 C 标准 所 讲述 的 
C 标准 库 的 方方面面 。ISO 是 制定 C 标准 的 最 高 机 构 。 如 果 你 认为 我 的 解释 
和 C 标准 有 出 人 ， 请 以 C 标准 为 准 。 很 有 可 能 是 我 错 了 。 

你 经 常会 发 现 C 标准 难于 阅读 。 其 实 ， 它 这 是 有 意 用 一 种 法 律 措 词 来 阐释 
C 标准 。 一 个 标准 首先 一 定 是 准确 和 严密 的 ， 其 次 才 考 虑 可 读 性 。 制 定 标准 的 
文档 也 无 意 去 充当 用 户 的 学 习 教 程 。X3J11 也 附 随 C 标准 提供 了 一 个 Rationale. 
如 果 你 对 X3J11 所 做 的 某 些 决定 有 些 好 奇 ， 阅 读 一 下 Rationale 也 许 会 有 所 帮 
助 。 但 是 ， 需 要 强调 的 是 ，Rationate 也 不 是 关于 标准 C 的 学 习 教 程 。 


D 最 新 的 C iB A RE ISO/IEC 9899:1999 (C99)。 一 一 编者 注 
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小 数 点 


标准 头 文件 


保留 的 标识 条 


简 4 


下 面 有 引 自 ISO C 标准 的 两 段 话 。 第 一 段 介 绍 了 C 标准 的 库 部 分 。 它 提供 
了 一 些 定义 和 几 个 重要 的 基本 原则 ， 这 些 原则 从 整体 上 影响 了 标准 库 的 实现 。 
7.Æ 
7154 
7.1.1 名 词 定 义 

` 字符 囊 是 以 第 一 个 出 现 的 空 字符 作为 结束 且 包 含 该 空 字 符 的 连续 的 字符 序列 。 指 向 字 
符 串 的 指针 指向 它 的 第 一 个 (最 低 编 址 ) 字符 。 一 个 字符 串 的 长 度 是 空 字符 前 面 的 字符 的 
数目 ， 它 的 值 是 它 所 含 字符 的 值 的 相同 顺序 的 序列 。 

字母 是 指 执行 字符 集中 的 可 打印 字符 ， 它 可 以 是 5.2.1 中 列 出 的 源 字 符 集 中 的 52 个 大 
小 写字 母 中 的 任意 一 个 。 

小 数 点 字符 是 对 浮 点 数 和 字符 序列 进行 转换 的 函数 所 使 用 的 符号 ， 用 来 指示 这 种 
字符 序列 的 小 数 部 分 的 起 始 位 置 * 它 在 文本 和 例子 中 用 一 个 句点 来 表示 ， 但 可 以 被 
setlocale PRÉ I . 

SN: FFF (73). setlocale FÅ (7.4.1.1). 

7.1.2 标准 头 文件 

每 一 个 库 函 数 都 在 一 个 头 文件 旦 中 声明 ， 头 文件 的 内 容 可 以 通过 一 个 #include 预 处 
理 指令 来 使 用 。 头 文件 声明 了 一 组 相关 的 函数 ， 还 包括 使 用 的 一 些 必需 的 类 型 和 一 些 附加 
WE. 


标准 头 文件 有 : 
<assert.h> <locale.h> «stddef.h» 
«ctype.h» «math.h» <stdio.h> 
<errno.h> «setjmp.h» «stdlib.h» 
<float.h> <signal.h> «string.h» 
<limits.h> <stdarg.h> «time.h» 


如 果 有 一 个 文件 的 名 称 和 上 面 的 尖 括 号 中 的 任何 一 个 字符 序列 相同 ， 但 不 是 作为 语言 实 
现 的 一 部 分 提供 的 ， 而 又 放置 在 可 供 源 文件 包含 的 任何 标准 位 置 ， 那 么 这 种 行为 是 未 定义 的 。 
头 文件 可 以 以 任何 顺序 被 包含 ， 每 个 头 文件 都 可 以 在 一 个 给 定 的 范围 内 被 包含 多 次 ， 
这 和 它 被 包含 一 次 的 效果 相同 ， 但 包含 «assert.h» 的 效果 取决 于 NDEBUG 的 定义 。 如 果 要 
n 个 头 文件 ， 它 应 该 被 包含 在 任何 外 部 声明 或 者 定义 的 外 面 ， 而 且 应 该 在 第 一 次 引用 
声明 的 任何 函数 或 对 象 ， 或 者 它 定 义 的 任何 类 型 和 宏 之 前 被 包含 。 然 而 ， 如 果 一 "AM 
符 在 多 个 头 文件 中 定义 或 者 声明 ， 那么 第 二 个 和 后 来 的 头 文件 可 以 在 对 这 个 标识 符 的 第 一 
SULA OE HERE 
参见 : 诊断 (7.2). 
713 BREE 


一 个 头 文件 都 声明 或 者 定义 了 在 其 相关 联 的 标准 条 款 ? 中 列 出 的 所 有 标识 符 ， 而 且 
EXFL UE D RE LHR IN LS ERU BYE A RE E BURR FARIN 
文件 范围 标识 符 或 其 他 用 途 的 标识 符 。 

。 所 有 以 下 划 线 加 一 个 大 写字 母 或 者 两 条 下 划 线 开头 的 标识 符 都 被 保留 作 任何 用 途 。 
。 所 有 以 下 划 线 开头 的 标识 符 通 常 都 在 普通 标识 符 和 标记 命名 空间 方面 作为 文件 作 
用 域 标识 符 使 用 。 


(D 指 C 标准 中 说 明 相 应 头 文件 的 条 款 ， 如 «assert.ho 的 相关 联 条 款 是 C 标准 中 的 7.2 节 。 一 一 编者 注 


02 C 标准 的 内 容 5 


库 函 数 的 使 用 


e 后 面 的 任何 子 句 〈 包 括 库 的 展望 ) 中 列 出 的 每 个 宏 名 都 被 保留 作 任何 用 途 ， 如 果 
它 的 任何 相关 头 文件 被 包含 。 

。 后 面 的 子 句 中 《〈 包 括 库 的 展望 ) 所 有 有 具有 外 部 连接 的 标识 符 都 被 保留 为 具有 外 部 
连接 的 标识 符 使 用 ”。 

e 每 一 个 在 后 面 的 子 句 (包括 库 的 展望 ) 中 列 出 的 文件 作用 域 标识 符 都 被 保留 ， 作 
为 一 个 相同 命名 空间 中 具有 文件 作用 域 的 标识 符 来 使 用 ， 只 要 它 的 任何 一 个 相关 
头 文件 被 包含 了 。 

保留 的 标识 符 只 有 以 上 这 些 。 如 果 一 个 程序 声明 或 者 定义 了 一 个 标识 符 ， 这 个 标识 符 

和 上 下 文 环境 中 保留 的 标识 符 同名 〈 不 同 于 7.1.7 中 所 允许 的 )， 那 么 这 种 行为 是 未 定义 的 ”。 
脚注 

88. få FA h% FA BR ÅÅ localeconv, fprintf, fscanf, printf, scanf, 
sprintf, sscanf, vfprintf, vprintf, vsprintf, atof 和 strtod, 

89. 头 文 件 不 一 定 是 一 个 源 文 件 ， 头 文件 名 字 中 巾 尖 括 号 括 住 的 字符 序列 也 不 一 定 是 
有 效 的 源 文件 名 字 。 

90. 上 共有 外 部 连接 的 保留 标识 符 包 括 errno, setjmp 和 va end. 

91. 内 为 宏 名 只 要 存在 ， 就 会 被 代替 ， 而 和 作用 域 和 命名 空间 无 关 ， 所 以 ， 如 果 相 关 
的 头 文件 被 包含 了 ， 和 任何 保留 的 标识 符 的 名 字 相 匹配 的 宏 名 一 定 不 能 定义 。 


第 二 段 引 用 描述 了 C 标准 库 里 库 函 数 的 使 用 方式 。 


7.1.7 库 函 数 的 使 用 


下 面 的 每 一 个 语句 都 成 立 ， 除 非 后 面 有 另外 明确 的 详细 描述 。 如 果 一 个 苑 数 参 数 有 一 
个 无 效 值 〈 例 如 ， 函 数 的 定义 域外 的 一 个 值 ， 或 者 程序 的 地 址 空间 外 的 一 个 指针 ， 或 者 一 个 
空 指针 )， 那 么 这 种 行为 未 定义 。 如 果 一 个 函数 参数 被 描述 为 一 个 数组 ， 那 么 实际 传递 给 示 
数 的 指针 应 该 有 一 个 值 ， 这 样 所 有 的 地 址 计算 和 对 象 访问 《如果 指针 确实 指向 这 个 数组 的 第 
一 个 元 素 ， 那 么 它 就 是 有 效 的 ) 实际 上 都 是 有 效 的 。 在 一 个 头 文件 中 声明 的 任何 -一 个 函数 可 
能 又 作为 该 头 文 件 中 的 一 个 宏 实现 了 。 所 以 ， 即 使 它 的 头 文件 被 包含 了 ， 它 的 库 函 数 也 不 一 
定 被 显 式 声明 了 。 一 个 函数 的 任何 宏 定义 都 可 以 通过 用 括号 把 函数 的 名 字 括 住 来 局 部 地 抑制 
它 ， 因 为 这 个 名 字 后 面 没有 跟着 指示 一 个 宏 函 数 名 展开 的 左 括号 。 同 理 ， 即 使 一 个 库 函 数 也 
作为 宏 被 定义 了 “， 获 得 该 函数 的 地 址 还 是 允许 的 。 用 来 移 除 任何 宏 定义 的 tundet 预 处 理 
指令 的 使 用 也 可 以 保证 实际 函数 的 引用 。 一 个 作为 宏 实现 的 库 函 数 的 任何 调用 都 会 一 次 展开 
为 精确 地 计算 它 的 每 一 个 参数 的 代码 ， 必 要 时 可 以 完全 用 括号 保护 起 来 ， 所 以 ， 通 常情 况 
下 ， 使 用 任何 表达 式 作为 参数 都 是 安全 的 。 同 样 ， 那 些 在 下 面子 句 中 描述 的 类 似 于 函数 的 
宏 可 能 会 在 一 个 表达 式 中 调用 ， 这 个 表达 式 可 以 在 具有 可 兼 容 的 返回 值 类 型 的 陋 数 被 调用 
的 任何 地 方 “。 所 有 展开 为 整 型 常量 表达 式 的 类 似 于 对 象 的 宏 都 适用 于 #if 预 处 理 指令 。 

如 果 不 引 用 一 个 头 文 件 中 的 任何 类 型 定义 就 可 以 声明 一 个 库 函 数 ， 那 么 显 式 或 者 隐 式 
地 声明 这 个 函数 都 是 允许 的 ， 并 且 不 用 包含 它 的 相关 头 文件 就 可 以 使 用 它 。 如 果 一 个 接收 
可 变 参数 列表 的 函数 没有 被 声明 〈 显 式 地 或 者 通过 包含 相关 头 文件 )， 那 么 它 的 行为 未 定义 。 

例子 

函数 atoi 可 以 通过 以 下 几 种 方式 使 用 : 

© 通过 相关 头 文件 的 使 用 可 能 生成 一 个 宏 展开 )。 
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简 4 


引用 ISO 标准 


#include <stdlib.h> 
const char *str; 
J.S 

i = atoi(str); 


。 通过 相关 头 文件 的 使 用 确实 生成 了 一 个 真正 的 函数 引用 )。 


#include <stdlib.h> 
#undef atoi 
const char *str; 


Z t... 4 
i = atoi(str); 
或 者 


#include <stdlib.h> 
const char *str; 
£ot... d 

i = (atoi) (str); 


e 通过 显 式 声明 。 


extern int atoi(const char *); 
const char *str; 

nd 

i = atoi (str): 


e 通过 隐 式 声明 。 


const char *str; 


脚注 

95. 那 就 是 说 ， 一 个 实现 必须 为 每 个 库 消 数 提供 一 个 实际 的 函数 ， 即 使 它 已 经 为 该 消 
数 提供 了 一 个 宏 。 

96. 因为 外 部 标识 符 和 某 些 以 下 划 线 开头 的 宏 名 是 保留 的 ， 实 现 可 能 对 这 些 名 字 提 供 
特定 的 语义 。 例 如 ， 标 识 符 BUILTIN abs 可 以 用 来 说 明 函 数 abs 内 联 代码 的 产生 。 
因此 ， 正 确 的 头 文件 能 为 一 个 其 代码 生成 器 可 以 接受 这 个 标识 符 的 编译 器 指定 如 
下 内 容 。 

#define abs (x) , BUILTIN abs (x) 
通过 这 种 方式 ， 如 果 一 个 用 户 希望 保证 像 abs SER AE VERSUS VASA 
消 数 ， 他 可 能 会 这 样 编写 : 


#undef abs 
而 不 论 实现 的 头 文件 是 否 提供 了 abs 的 一 个 宏 实现 或 者 内 置 实现 。 因 而 ， 前 面 
被 任意 宏 定义 掩盖 的 函数 原型 也 因此 显露 出 来 了 。 
注意 ， 对 引 自 ISO C 标准 中 的 每 个 语句 我 都 做 了 明显 的 标记 。 它 们 的 字 
体 和 正文 相同 ， 字 号 比 正文 小 。 我 在 引用 的 左边 画 了 一 条 粗 线 〈 那 条 线 左边 
的 注释 是 我 做 的 )。 每 个 引用 都 包含 了 至 少 一 个 编号 ， 以 明确 它 在 C 标准 中 
的 位 置 。 我 收集 了 引用 中 要 用 到 的 所 有 脚注 并 把 它们 列 在 引用 的 最 后 。 
我 对 ISO C 标准 摘录 部 分 进行 了 排版 ， 所 使 用 的 《机 器 可 识别 ) 文本 与 
C 标准 的 文本 是 相同 的 。 当 然 ， 换 行 和 换 页 不 同 。 但 是 ， 需 要 提醒 的 是 ， 我 
编辑 了 该 文本 ， 大 量 修改 了 其 中 的 排版 标记 ， 因 此 可 能 引入 了 一 些 错误 ， 而 
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03 库 的 使 用 


头 文件 的 使 用 


后 来 校对 的 时 候 并 没有 发 现 这 些 错误 。 所 以 ， 还 是 那 句 话 ，C 的 最 终 权 威 是 
你 从 ISO 和 ANSI 那里 获得 的 印刷 版 的 C 标准 。 


C 标准 对 于 用 户 应 如 何 使 用 C 标准 库 有 很 多 说 明 ， 其 中 最 重要 的 两 点 是 : 


O 怎样 使 用 库 的 头 文件 ; 
口 怎样 在 程序 中 创建 库 名 。 


C 标准 库 提 供 了 15 个 标准 头 文件 。 任 何 预定 义 但 没有 在 C 语言 中 定义 
的 符号 各 都 在 一 个 或 多 个 标准 头 文件 中 定义 了 。 这 些 头 文件 具有 以 下 几 个 特性 。 
O 具有 爱 等 性 。 可 以 多 次 包含 相同 的 标准 头 文件 ， 但 效果 与 只 包含 一 次 
相同 。 
O 相互 独立 。 任 何 标准 头 文件 的 正常 工作 都 不 需要 以 包含 其 他 标准 头 文 
件 为 前 提 。 也 没有 任何 标准 头 文件 包含 了 其 他 标准 头 文件 。 
口 和 文件 级 别 的 声明 等 同 。 必 须 先 把 某 标准 头 文件 包含 到 你 的 程序 中 ， 
然后 才能 使 用 该 头 文件 已 定义 或 声明 的 东西 。 不 能 在 声明 中 包含 标准 
头 文件 。 并 且 ， 也 不 能 在 包含 标准 头 文件 之 前 用 宏 定义 去 代替 关键 字 。 
在 C 程序 员 中 所 达成 的 一 个 约定 是 : C 源 文件 的 开头 部 分 要 包含 所 有 要 
用 到 的 头 文件 。 在 Hinclude 指令 之 前 只 能 有 一 句 注 释 语句 。 你 可 以 按 任何 
顺序 书写 这 些 头 文件 一 一 我 喜欢 把 它们 按 字 母 表 的 顺序 排列 。 不 要 理会 C Er 
准 有 关 函 数 声明 的 其 他 方式 。 
你 的 程序 可 能 会 用 到 你 自己 的 头 文件 。 不 要 用 任何 标准 头 文件 的 名 字 为 你 
的 头 文 件 命名 。 也 许 你 会 在 某 个 系统 上 侥幸 成 功 ， 但 换 一 个 系统 你 就 会 遭遇 失 
败 。 一 个 广泛 使 用 的 惯例 是 ， 按 以 下 形式 对 C 源 文件 名 和 头 文件 名 命名 : 


D 以 小 写字 母 开 头 ; 
Oc 接着 使 用 1 ~ 7 个 小 写字 母 和 数字 ; 
O 以 .c 作 为 C 源 文件 名 的 后 级 ，.h 作为 头 文件 名 的 后 缀 。 


例如 i80386.h, matrix.c 和 plot.h。 这 些 形式 的 文件 名 适用 于 大 多 数 
的 C 编译 器 。 除 第 一 个 字母 外 ， 你 甚至 可 以 通过 使 用 至 多 5 个 另外 的 小 写字 
母 和 数字 来 获得 更 好 的 可 移植 性 ， 这 是 C 标准 所 建议 的 。 然 而 ， 我 发 现 ， 这 
些 较 长 的 文件 各 的 可 移植 性 〈 和 隐藏 性 ) 已 经 很 好 了 。 


你 写 的 头 文件 可 能 会 用 到 标准 头 文件 中 的 定义 或 者 声明 。 如 果 是 这 样 的 
话 ， 你 最 好 把 标准 头 文件 包含 在 你 所 写 的 头 文件 的 开头 。 这 就 消除 了 C 程序 


源 文件 中 包含 头 文件 的 顺序 问题 。 不 要 为 在 一 个 翻译 单元 中 多 次 包含 同一 标 


准 头 文件 而 担心 ， 这 正 是 可 利用 头 文件 寡 等 性 的 地 方 。 


8 Souz 简 介 
对 你 自己 的 头 文件 使 用 另 一 种 形式 的 include 指令 是 个 好 习惯 ， 用 双 
引号 包含 头 文 件 名 ， 而 不 是 用 尖 插 号， 只 有 引用 标准 头 文件 时 才 使 用 尖 括 号 。 
例如 ， 你 可 能 在 一 个 C 源 文件 的 开头 写 人 以 下 内 容 : 
#include <stdio.h> 
#include "plot.h" 
我 的 做 法 是 首先 列 出 标准 头 文件 。 但 如 果 你 按照 前 面 的 建议 做 ， 就 无 需 这 样 
做 了 。 我 遵循 这 种 做 法 只 是 想 把 随意 性 减 到 最 小 。 
命名 空间 C 标准 库 有 非常 清晰 的 命名 空间 。 库 定义 了 200 个 外 部 名 字 。 除 此 之 外 ， 


图 0-1 
命名 空间 


它 还 保留 了 某 种 类 别 的 名 字 供 库 的 实现 者 使 用 。 语 言 的 使 用 者 可 以 使 用 除 此 
之 外 的 所 有 名 字 。 图 0-1 展示 了 C 程序 中 存在 的 命名 空间 ， 该 图 出 自 Mauger 
和 Brodie 的 Standard C 一 书 ， 它 告诉 我 们 可 以 定义 一 套 自由 的 命名 空间 。 


. D 每 个 块 〈 函 数 中 以 大 括号 包含 的 部 分 ) 引入 了 两 个 新 的 命名 空间 。 一 
个 包括 了 所 有 作为 类 型 定义 、 孙 数 、 数 据 对 象 和 枚 举 常 量 声明 的 名 
字 ， 男 一 个 则 包括 了 所 有 枚 举 、 结 构 和 联合 的 标记 。 

口 你 定义 的 每 一 个 结构 或 联合 都 引入 了 一 个 新 的 命名 空间 ， 其 中 包括 了 


所 有 成 员 的 名 字 。 
口 你 声明 的 每 一 个 函数 原型 引入 了 一 个 新 的 命名 空间 ， 其 中 包括 了 所 有 
的 参数 名 。 
D 你 定义 的 每 一 个 函数 引入 了 一 个 新 的 命名 空间 ， 其 中 包括 所 有 标号 的 
名 字 。 
最 内 层 代码 块 文件 层次 
类 型 定义 
e 函数 
数据 对 象 


枚 举 类 型 
枚 举 类 型 标签 


枚 举 类 型 标签 
结构 类 型 标签 结构 类 型 标签 
联合 类 型 标签 联合 类 型 标签 


函数 原型 中 结构 或 联合 类 型 的 参数 的 成 员 


函数 原型 中 结构 或 联合 类 型 的 参数 的 成 员 


goto 语句 标号 
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在 一 个 给 定 的 命名 空间 中 你 只 能 以 一 种 方式 使 用 一 个 名 字 。 如 果 翻 译 器 
识别 出 一 个 名 字 属 于 某 个 命名 空间 ， 它 就 看 不 到 这 个 名 字 在 另 一 个 命名 空间 
的 其 他 用 途 。 图 0-1 左边 的 命名 空间 块 会 掩盖 住 其 右边 的 命名 空间 块 。 因 此 ， 
宏 可 能 会 掩盖 住 关键 字 。 这 两 者 之 间 的 任何 一 个 者 和 掩盖 其 他 类 型 的 名 字 。 
《例如 ， 你 不 能 把 数据 对 象 的 名 字 定 义 为 while.) 


在 实际 使 用 中 ， 你 应 该 把 所 有 的 关键 字 和 库 名 作为 所 有 命 dek s 间 中 的 保 
留 字 。 这 会 使 你 和 代码 的 未 来 读者 可 能 遇 到 的 混淆 减 到 最 少 。 只 有 忘记 了 库 
中 一 个 很 少 用 到 的 名 字 时 ， 才 能 依靠 单独 的 命 空间 来 六 加 ”如 时 必须 做 ` 
些 冒 险 的 事情 ， 比 如 定义 一 个 宏 来 代替 一 个 关键 字 ， 那 么 一 定 要 很 小 心 并 且 
清楚 地 记录 下 这 些 项 目 。 写 程序 的 时 候 一 定 不 要 使 用 以 下 某 些 类 型 的 名 字 ， 
它们 是 留 给 库 的 实现 者 使 用 的 。 

O 以 下 划 线 开头 且 具 有 外 部 连接 属性 的 顺 数 和 数据 对 象 的 名 字 ， 例 如 

abc 或 者 DEF, 

口 以 两 个 下 划 线 或 一 个 下 划 线 加 一 个 大 写字 母 开 头 的 宏 名 ， 例 如 

. abc 或 者 DEF, 


记 住 ， 宕 的 名 字 可 以 掩盖 其 他 任意 命名 空间 的 名 字 ， 第 二 类 名 字 在 所 有 的 命 
名 空间 中 都 被 有 效 地 保留 


0.4 库 的 实现 


本 书后 面 出 现 的 代码 是 在 一 些 假设 的 基础 上 写 出 来 的 。 如 果 想 在 一 个 
指定 的 C 实现 上 使 用 这 些 代码 ， 必 须 确定 这 些 假设 在 这 些 实现 上 是 成 
KVA 


DO 可 以 用 一 个 同名 的 C 源 文 件 代替 标准 库 头 文件 ， 例 如 assert .h。 编 译 
器 可 以 把 标准 头 文件 的 名 字 作 为 保留 字 ， 包 含 一 个 头 文件 可 以 很 容易 
地 打开 构建 在 翻译 器 中 的 一 系列 定义 。 这 样 的 编译 器 可 能 会 带 来 一 些 
问题 。 

O 可 以 代替 不 完整 的 标准 头 文件 。 你 可 能 只 想 测 试 这 里 给 出 的 代码 的 一 
部 分 。 即 使 你 最 终 想 把 它们 都 试 一 下 ， 也 不 会 马上 完成 所 有 的 工作 。 

O 可 以 用 包括 了 这 个 函数 的 常规 定义 的 C 源 文 件 蔡 换 预 定义 的 函数 。 编 译 
器 可 以 把 库 函 数 的 外 部 名 字 作 为 保留 字 ， 调 用 一 个 库 函 数 可 以 很 容易 
地 扩展 为 内 联 代码 。 这 样 的 编译 器 可 能 会 带 来 一 些 问题 。 

C) 可 以 一 点 一 点 地 替换 一 些 预定 义 的 函数 。 编 译 器 可 以 把 很 多 库 函 数 连 
接 到 一 个 目标 模块 里 面 。 这 种 方法 也 适用 于 代替 标准 头 文 件 。 

D C 源 文 件 名 应 该 至 多 有 8 个 小 写字 母 ， 后 面 是 一 个 点 和 一 个 小 写字 母 。 
这 是 我 在 0.3 节 描 述 的 形式 。 
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介 


口 


外 部 名 字 可 能 把 所 有 的 字母 和 一 种 形式 的 字母 相对 应 ， 也 可 能 不 是 。 
这 里 给 出 的 代码 在 两 种 情况 下 都 能 正确 工作 。 


你 的 编译 器 不 可 能 和 所 有 这 些 假设 不 符 ， 否则 ， 只 能 通过 使 用 一 些 技巧 
才能 “合作 ”。 大 部 分 C 的 厂商 都 用 C 语言 编写 库 ， 并 且 使 用 他 们 自己 的 翻 
译 器 。 他 们 也 需要 这 样 做 。 


编程 风格 本 书 的 代码 都 遵循 很 多 风格 规范 ， 其 中 大 部 分 规范 都 适用 于 所 有 的 项 
目 ， 只 有 少数 比较 特殊 。 


口 


库 中 的 每 一 个 可 见 函 数 都 占据 着 单独 的 COME. TATE AK 
名 《如 果 有 必要 的 话 ， 名 字 要 变 为 8 个 字符 ) 后 面 加 上 .c 后缀。 
DH. PU strlen 就 在 文件 strlen.c 中 。 在 某 些 情况 下 ， 这 会 
生成 很 小 的 文件 。 它 简化 了 函数 查找 。 附 录 B 列 出 了 库 中 定义 的 每 
一 个 可 见 函 数 名 ， 同 时 也 给 出 了 定义 该 名 字 的 文件 所 在 的 页 码 。 

每 个 隐藏 的 名 字 都 以 一 个 下 划 线 跟 一 个 大 写字 母 开 头 ， 如 Getint. 
附录 B 也 列 出 了 所 有 有 外 部 连接 或 在 标准 头 文件 中 定义 的 隐藏 的 名 字 。 
库 中 隐藏 的 郧 数 和 数据 对 象 通常 占据 以 x 开 头 命名 的 C 源 文件 ， 如 


. xgetint.c。 这 样 的 文件 可 以 包含 多 个 函数 或 数据 对 象 ， 文 件 名 源 月 


它 包含 的 某 个 函数 或 数据 对 象 的 名 字 。 

代码 排版 也 相当 统一 。 我 通常 尽 可 能 在 艇 套 里 层 的 消 数 中 声明 数据 对 
象 。 我 用 工整 的 缩 进来 说 明 控 制 结构 的 徐 套 ， 我 也 在 每 个 函数 里 面 的 
左 大 括号 CO 的 后 面 写 上 一 行 注 释 。 

代码 不 包括 register 声明 ， 因 为 它们 不 容易 安排 并 且 会 使 代码 混 
乱 。 此 外 ， 现 代 的 编译 器 能 比 程序 员 更 好 地 分 配 寡 存 器 。 

fE— TERT DRANGE NUT, FÅ BIE STE (Shot 节 
strlen 的 定义 )。 所 有 这 样 的 函数 声明 都 会 被 相应 的 头 文件 中 的 宏 定 
义 所 掩盖 ， 所 以 这 对 括号 阻止 了 翻译 程序 识别 和 展开 安 。 

本 书 中 的 C 源 文件 都 以 一 个 带 边 框 的 图 的 形式 给 出 ， 图 的 说 明 中 有 
文件 的 名 字 。 有 些 比较 大 的 文件 会 出 现在 两 个 页 面 中 ， 这 样 的 图 在 每 
页 的 说 明 中 都 会 提示 你 本 页 中 出 现 的 代码 只 是 源 文件 的 一 部 分 。 

每 个 网 显示 的 C 源 代 码 都 使 用 只 占 4 列 的 水 平 制 表 符 来 缩 进 。 显 示 
的 代码 和 实际 的 源 文 件 有 两 点 不 同 ; 代码 右边 的 注释 都 经 过 调整 而 
没有 换行 ， 每 个 C 源 文件 的 最 后 一 行 的 结尾 都 用 一 个 方 框 字符 ( 口 ) 
做 标记 。 
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头 文件 的 实现 


SEI 


相互 独立 性 


因而 最 后 的 代码 有 时 候 显得 很 密集 。 对 于 一 般 的 编码 项 目 ， 我 会 加 一 些 
空白 使 它 至 少 增 大 20%。 为 了 使 本 书 不 会 变 得 更 厚 ， 这 些 代 码 都 是 经 过 压缩 
的 。 


代码 还 包括 很 多 应 当 合理 地 合并 到 一 起 的 文件 。 就 像 上 面 提 到 的 ， 把 所 
有 可 见 的 隔 数 放 到 单独 的 文件 中 会 产生 一 些小 得 离谱 的 目标 模块 。 我 也 额外 
引入 了 一 些 C 源 文件 以 保证 所 有 的 文件 在 两 页 的 长 度 之 内 。 但 是 ， 这 并 不 是 
我 压缩 文件 的 唯一 原因 。 开 始 我 写 的 C 源 文 件 和 它 的 自然 长 度 相同 ， 不 管 它 
有 多 大 。 我 用 的 每 一 个 编译 器 在 翻译 大 文件 的 时 候 都 至 少 有 一 个 不 能 成 功 翻 
译 。 那 些 额外 的 模块 有 时 可 能 称 不 上 是 好 的 设计 ， 但 它们 在 实践 中 确实 提高 
了 可 读 性 和 可 移植 性 。 


本 书 中 实现 的 15 个 源 文 件 都 是 标准 头 文件 。 前 面 我 列 出 了 标准 头 文件 
的 几 个 特性 一 一 客 等 性 、 相 互 独立 性 和 声明 等 价 性 。 所 有 这 些 特性 都 会 对 你 
实现 标准 头 文件 有 影响 。 


震 等 性 很 容易 应 付 ， 对 大 多 数 的 标准 头 文 件 可 以 使 用 宏 保 护 。 例 如 ， 你 
可 以 通过 有 条 件 地 最 多 包含 以 下 内 容 一 次 来 保护 <stdio.h>; 


#ifndef _STDIO_H 
#define _STDIO_H 
.../*BODY OF <stdio.h> */ 


#endif 
当然 ， 那 个 有 趣 的 宏 名 _STDIO_H 属于 为 实现 者 保留 的 一 类 名 字 。 


对 头 文件 <assert.h>， 你 不 能 使 用 这 种 机 制 。 它 的 行为 受 程序 员 可 选 
择 定 义 的 宏 名 NDEBUG 的 控制 。 每 次 程序 中 包括 这 个 头 文件 的 时 候 ， 该 头 
文件 关闭 或 者 打开 宏 assert， 这 取决 于 翻译 单元 中 的 这 个 点 是 否定 义 了 宏 
NDEBUG。 第 1 章 中 会 进一步 讨论 这 些 内 容 。 

有 两 个 问题 使 得 保持 头 文件 之 间 的 相互 独立 性 有 一 点 麻烦 。 一 个 是 有 些 
名 字 会 在 多 个 头 文件 中 定义 。 一 个 程序 应 该 可 以 包含 两 个 定义 了 相同 名 字 的 
头 文件 而 不 会 造成 错误 。 类 型 定义 size t 就 是 一 个 例子 。 它 是 使 用 操作 符 
sizeof 所 产生 的 类 型 (参照 第 11 章 )。 你 可 以 使 用 另 一 个 宏 保护 来 防止 这 种 
类 型 的 多 次 定义 。 

tifndef SIZE T 

#define SIZE T 


typedef unsigned int size t; 
#endif 


E NULL 是 另外 一 个 例子 。 你 可 以 在 任何 一 个 想 引 人 指向 数据 对 象 的 空 
指针 《一 个 没有 指派 数据 对 象 的 指针 值 ) 的 地 方 使 用 这 个 宏 。 定 义 这 个 宏 的 
一 种 方式 是 : 
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同 义 字 


文件 级 别 的 
头 文件 


#define NULL (void zi 0 


在 一 个 翻译 单元 中 包含 这 样 的 宏 定义 的 多 个 实例 不 会 造成 任何 损失 。 标 准 C 
允许 宏 的 良性 重 定义 。 具 有 相同 宏 名 的 两 个 定义 必须 具有 相同 的 记号 序列 。 
它们 只 能 是 记号 之 间 的 空白 不 同 〈 这 里 的 空白 指 空格 符 和 制 表 符 )。 没 有 必要 
阻止 包含 两 个 符合 这 种 情况 的 定义 。 
然而 ， 你 必须 在 多 个 地 方 提供 相同 的 定义 ， 这 是 一 个 烦人 的 维护 问题 。 
这 里 有 两 种 解决 办 法 : 
O 在 多 个 地 方 编写 相同 的 定义 。 定 义 改变 时 ， 就 要 找 出 这 个 定义 的 所 有 
实例 。 
C) 把 定义 放 在 一 个 独立 的 头 文件 中 ， 给 这 个 文件 起 一 个 不 会 和 程序 员 创 
建 的 文件 名 冲突 的 名 字 。 在 每 个 用 到 该 定义 的 头 文件 中 包含 这 个 头 文 
件 。 


我 选择 第 二 种 解决 方法 〈 大 多 数 情况 )， 因 为 它 简化 了 使 库 适 用 于 不 同 的 编 
译 器 所 做 的 工作 。 


3 个 输出 函数 vEprintf£, vprintf 和 vsprintf 出 现 了 一 个 相似 但 又 不 
同 的 问题 。 当 你 想 打 印 一 些 或 全 部 可 变 参 数 表 的 时 候 ， 可 以 调用 这 些 困 数 ， 
它们 接受 一 个 可 变 参 数 表 。 这 3 个 函数 都 在 头 文件 <stdio.h> 中 声明 ， 每 个 
函数 都 有 一 个 va list 类 型 的 参数 。 但 是 该 类 型 并 没有 在 <stdio.h> PE 
义 , 它 只 在 头 文件 «stdarg.h» 中 定义 。 这 时 该 怎么 办 呢 ? 


如 果 细 心 一 点 的 话 ， 你 会 发 现 答案 很 简单 。 头 文件 <stdio.h> ÆRE 
含 一 个 va_list 类 型 的 同 义 字 ， 同 义 字 有 一 个 为 宕 保留 的 名 字 。 在 一 个 标准 
头 文件 内 部 表达 这 3 个 函数 中 的 每 一 个 函数 的 原型 ， 做 这 么 多 就 够 了 。( 当 
然 ， 实 现 者 就 面临 着 复制 多 个 头 文件 中 的 可 见 定义 和 同 义 字 的 问题 。) 


作为 程序 员 ， 没 有 定义 va list 类 型 就 去 使 用 这 些 函 数 是 很 困难 的 。 
(可 以 实现 ， 但 或 许 不 是 一 个 好 的 方式 。) 这 就 意味 着 在 任何 想 使 用 这 些 函 数 
的 时 候 ， 你 可 能 会 想 包含 头 文件 <stdarg.h>。 所 以 ， 这 仍然 是 程序 员 的 工 
作 。 编 译 器 没 必要 〔〈 而 且 禁 止 ) 在 每 次 程序 包含 头 文件 <stdio.h> 的 时 候 都 
把 头 文件 <stdarg.h> 拉 进 来 。 


标准 头 文件 最 后 的 这 个 特性 是 完全 有 利于 实现 者 的 。 程 序 员 必 须 在 允许 
文件 级 别 声 明 的 地 方 包含 -一 个 标准 头 文件 。 这 就 意味 着 预 处 理 指 令 include 
不 能 出 现在 另 一 个 声明 内 的 任何 地 方 。 大 多 数 标准 头 文件 必须 包含 一 个 或 多 
个 外 部 声明 。 这 些 只 在 某 些 上 下 文 环 境 中 允许 。 没 有 这 个 限制 性 条 件 ， 很 多 
标准 头 文件 都 不 能 作为 普通 的 C 源 文 件 编写 。 
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0.5 FANA 


测试 所 有 路 径 


规格 确认 


性 能 测试 


测试 是 一 个 永恒 的 话题 。 只 有 最 小 的 函数 能 测试 它 的 所 有 情况 ， 即 使 这 
样 ， 也 不 能 测试 它 与 使 用 它 的 大 程序 的 所 有 交互 情况 。 你 不 得 不 测试 所 有 可 
能 的 输入 值 ， 或 者 至 少 尝试 通过 代码 的 所 有 可 能 的 路 径 。 如 果 你 的 目标 是 最 
终 证 明 一 个 函数 没有 任何 缺陷 ， 那 么 你 多 数 情况 下 不 可 能 达到 这 个 目标 。 


一 个 低 一 点 的 目标 是 写 出 测试 可 执行 代码 的 每 一 部 分 的 测试 。 这 和 测试 
代码 每 个 可 能 通过 的 路 径 有 很 大 的 不 同 。 然 而 ， 这 已 经 足够 在 很 高 的 水 平 上 
确保 代码 实质 上 是 正确 的 。 想 写 出 这 样 的 测试 ， 你 必须 知道 


D 代码 应 该 做 什么 (规格 说 明 ); 
D 它 是 怎样 做 的 (代码 本 身 )。 


那么 你 必须 设计 能 测试 规格 说 明 的 每 个 细节 的 测试 。( 我 故意 不 说 清楚 “ 细 
节 ” 都 包括 什么 .) 原则 上 ， 那 些 测试 应 该 可 以 访问 代码 的 每 一 个 “角落 ” 
每 一 条 代码 都 应 该 对 实现 规格 说 明 的 某 一 部 分 有 所 帮助 。 在 实践 中 ， 当 你 第 
一 次 分 析 规 格 说 明 的 时 候 ， 你 总 是 要 加 一 些 你 没有 预料 到 的 测试 。 


结果 是 一 个 复杂 的 代码 段 和 你 想 测试 的 代码 紧 紧 地 联系 在 一 起 。 测 试 
程序 可 能 和 待 测试 的 程序 一 样 复杂 ， 或 者 有 过 之 而 无 不 及 。 那 会 使 将 来 需 
要 维护 的 代码 数量 加 倍 。 一 块 代码 的 修改 会 引起 另 一 块 代码 的 改动 。 可 以 
使 用 一 块 代码 来 调试 另 一 块 代码 。 只 有 当 两 块 代码 协调 运行 时 ， 你 才能 说 
测试 完成 了 一 一 至 少 这 个 时 候 完成 了 。 所 有 这 些 投入 很 大 地 提高 了 代码 的 
可 靠 性 。 


另 一 种 测试 形式 是 确认 。 这 里 ， 你 的 目标 是 证 明代 码 在 多 大 程度 上 满足 
了 它 的 规格 说 明 ， 而 可 以 忽略 任何 实现 细节 。 厂 商会 知道 用 户 很 难看 到 的 程 
序 的 实现 细节 。 厂 商 既 对 测试 代码 的 内 部 结构 感 兴趣 ， 也 对 其 外 部 特征 感 兴 
趣 。 然 而 ， 客 户 应 该 主要 关心 一 个 产品 是 否 满 足 了 它 的 规格 说 明 ， 特 别 是 当 
他 们 在 比较 两 种 或 多 种 相互 竞争 的 产品 的 时 候 。 

还 有 一 种 形式 的 测试 是 性 能 测试 。 对 很 多 人 来 说 ， 性 能 就 是 速度 、 完 美 
和 简洁 。 但 是 ， 其 他 的 因素 会 同样 或 者 更 多 地 影响 性 能 。 例 如 ， 对 存储 器 和 
磁盘 的 要 求 ， 无 论 暂 时 的 还 是 持久 的 ， 或 者 可 预见 的 最 坏 情况 下 的 耗 时 。 好 
的 性 能 测试 : 

C) 测定 与 代码 各 种 使 用 方式 有 关 的 参数 ; 

O 能 被 独立 的 用 户 执 行 ; 

DO 有 可 重 现 的 结果 ; 

O 对 “足够 好 ”有 合理 的 标准 ; 


简单 测试 


O 对 “ 优 于 一 般 ” 和 “卓越 ”有 令 人 信服 的 标准 。 


有 太 多 所 谓 的 性 能 测试 都 违反 了 这 些 原 则 中 的 大 部 分 或 考 全 部 。 很 多 测 
试 都 是 测试 那些 容易 测试 的 部 分 ， 而 不 是 测试 值得 测试 的 部 分 。 


给 定 有 限 的 时 间 和 资金 ， 那 些 明 智 的 厂商 尽 可 能 多 地 加 大 在 这 些 形 式 
的 测试 方面 的 投入 。 在 代码 测试 之 前 应 该 设计 一 个 测试 计划 ， 还 应 该 把 全 
面 的 测试 作为 项 目的 一 部 分 。 理 想 情 况 下 ， 应 该 让 不 同 的 程序 员 来 写 代码 
和 测试 代码 。 还 应 该 从 外 部 资源 里 获得 独立 于 厂商 的 测试 系统 。 必 须 建立 
代码 修改 后 重新 测试 的 制度 。 和 提交 的 代码 一 样 ， 供 测试 用 的 机 器 也 应 该 
被 定时 维护 。 


在 开发 代码 方面 我 十 分 认可 这 样 的 专业 素质 。 然 而 ， 在 对 那 种 理想 情况 
说 了 那么 多 之 后 ， 只 能 到 此 打住 。 这 里 给 出 的 代码 已 经 广泛 地 经 过 了 几 种 现 
有 的 程序 和 组 件 的 确认 ， 但 是 我 并 没有 开发 一 个 测试 程序 来 测试 可 执行 代码 
的 每 一 个 部 分 。 本 书 给 出 了 太 多 的 代码 ， 所 以 增加 一 整套 合适 的 测试 实在 是 
太 难 实现 了 。 


相反 ， 我 写 了 很 多 简单 的 测试 程序 。 每 个 测试 程序 都 测试 了 C 标准 库 中 
每 个 标准 头 文件 提供 的 部 分 或 者 全 部 功能 。 你 会 发 现 这 些 测 试 程序 主要 定位 
于 外 部 行为 。 这 就 意味 着 ， 从 本 质 上 ， 它 们 组 成 了 一 个 简单 的 确认 系统 。 然 
而 ， 它 们 有 时 也 会 阁 进 内 部 结构 测试 的 领域 。 一 些 实现 错误 太 普 遍 、 危 害 性 
太 大 以 至 于 我 不 得 不 测试 它们 。 这 些 测试 程序 很 少 涉及 性 能 测试 。 


在 刚才 说 过 的 正当 测试 的 前 提 下 ， 大 多 数 情况 下 这 些 测 试 非常 粗略 和 简 
单 。 不 过 ， 即 使 简单 的 测试 也 能 达到 一 定 的 目的 。 只 需 用 几 行 代码 就 可 以 确 
认 一 个 函数 是 否 满足 了 它 的 基本 设计 目标 ， 这 又 确保 了 实现 的 健全 性 。 当 你 
做 一 些 修 改 的 时 候 修改 是 不 可 避免 的 )， 重 复 这 些 测试 来 保证 你 的 实现 仍 
然 健 全 。 简 单 的 测试 也 值得 编写 和 维护 。 

最 好 的 简单 测试 有 几 个 共同 的 特征 : 

口 打印 出 一 个 标准 的 确认 消息 ， 退 出 时 返回 成 功 的 状态 来 报告 执行 的 正 

确 性 ; 
D 识别 出 其 他 所 有 不 可 避免 的 输出 ， 以 把 代码 的 读者 遇 到 的 混乱 减 到 最 
小 ; 

O 提供 有 趣 的 独立 于 实现 的 信息 ， 和 否则 这 些 信息 很 难得 到 ; 

口 不 输出 其 他 的 东西 。 

我 已 经 养 成 了 在 每 个 头 文件 的 名 字 前 面 加 一 个 上 来 构建 测试 文件 的 名 
字 。 因 此 ，tassert.c 测 试 头 文件 <assert .h>。 它 保证 宏 assert 做 它 应 该 


做 的 工作 。 当 一 个 诊断 失败 时 它 会 告诉 你 库 的 输出 。 当 结束 对 <assert .h> 
的 测试 时 它 会 输出 SUCCESS testing «assert.h» 的 提示 信息 


就 像 在 tstdiol.c 和 tstdio2.c 中 的 一 样 ， 有 些 比 较 大 的 头 文件 要 求 
有 两 个 或 者 更 多 的 测试 程序 。 注 意 ， 每 个 这 样 的 文件 都 定义 了 它 自 己 的 main 
函数 。 你 可 以 把 每 一 个 文件 和 C 标准 库 链接 在 一 起 ， 生 成 一 个 独立 的 测试 程 
序 。 不 要 把 这 些 文件 中 的 任何 一 个 添加 到 C 标准 库 中 。 即 使 有 些 预定 义 的 
名 字 以 字母 t 开头 ， 我 仍然 选择 它 作 为 文件 的 第 一 个 字母 ， 因 为 它 有 助 于 记 
忆 ， 并 且 这 些 文件 名 和 库 中 所 有 国有 的 名 字 都 不 冲突 。 
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C 语言 的 事实 标准 流行 了 很 多 年 。 它 也 为 C 提供 了 一 个 非常 好 的 全 面 的 指 

南 。 第 2 版 加 入 了 ANSI C 标准 的 内 容 ， 也 是 一 本 很 好 的 指南 。 


P. J. Plauger and Jim Brodie, Standard C (Redmond, Wa.: Microsoft Press, 1989). 
这 本 书 为 整个 C 标准 提供 了 一 个 完整 但 又 简洁 的 参考 ， 它 覆盖 了 语言 和 库 两 
方面 的 内 容 。 

Thomas Plum, C Programming Guidelines (Cardiff, N.J.: Plum Hall, Inc.,1989 ) . 
这 是 指导 C 编程 风格 的 极 好 的 一 本 书 。 它 在 194 — 199 页 还 对 一 阶 正确 性 测 


试 进行 了 讨论 。 


FEB Sig RE EB A AERA PARK? 


C) 函数 使 用 广泛 。 

口 通过 生成 内 联 代码 函数 性 能 可 以 得 到 很 大 的 提高 。 
O 明 数 很 容易 编写 且 写 的 方式 有 多 种 。 

O RARE ifs t. 

O 写 函 数 引 入 了 一 些 有 趣 的 挑战 。 
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简 A 


O 在 过 去 的 应 用 中 函数 很 有 用 。 
D 函数 能 提供 很 多 相关 性 很 小 的 服务 。 
编写 一 个 包含 下 面 这 行 代码 的 《正确 的 ) 程序 ; 


x: ((struct x *)x)-»x = x(5); 


描述 x 的 5 个 不 同 的 用 途 。 你 能 举 一 个 在 程序 中 直接 用 到 其 中 任意 两 个 用 途 
的 例子 吗 ? 


考虑 下 面 的 序列 : 
double all = {1.0, 2.0}; 


double *p = a; 
double sar(x) {return (x*x);} 
#define sqr(x) x*x 


下 面 每 个 表达 式 的 结果 是 什么 ? 


sqr (3.0) 
sqr (3) 

sqr (3+3) 
'sqr (3) 
sqr (*p++) 
(sqr) (3+3) 


上 述 哪 个 表达 式 和 函数 调用 的 过 程 不 同 ? 

上 述 哪 个 表达 式 可 以 通过 改变 宏 的 定义 纠正 〈 错 误 )， 哪 个 不 能 ? 

如 果 标 准 头 文件 可 以 互相 包含 ， 你 必须 采用 什么 样 的 风格 来 避免 出 现 问题 ? 
[5 ] 如 果 标 准 头 文件 可 以 任意 定义 名 字 ， 程 序 员 应 该 怎样 做 才能 保证 -一 个 很 
大 的 程序 从 另 一 个 实现 中 移 过 来 时 仍 能 正确 地 运行 ? 

[ 很 难 ] 描述 一 种 实现 方法 ， 当 包含 标准 头 文件 时 ， 关 键 字 被 宏 掩 盖 而 不 出 
错 。 

[ 很 难 ] 描述 一 种 实现 方法 ， 该 方法 允许 标准 头 文件 包含 在 函数 定义 内 部 或 者 
一 个 源 文 件 的 任意 位 置 。 


E NDEBUG 


<assert.h> 


头 文件 <assert.h> 唯一 的 目的 就 是 提供 宏 assert 的 定义 。 可 以 在 程序 
中 关键 的 地 方 使 用 这 个 宏 来 进行 断言 。 如 果 一 处 断言 被 证 明 非 真 ， 我 们 希望 
| 一 条 适当 的 提示 信息 ， 并 且 使 执行 异常 终止 。( 第 12 
会 描述 怎样 写 到 流 中 。) 因此 ， 可 以 这 样 编写 : 


#include <assert.h> 


assertio «- idx && idx « sizeof a / sizeof a[0]); 
/* a[idx] is now safe */ 
如 果 遵 守 断 言 来 编程 ， 代 码 都 会 变 得 更 简单 。 它 不 需要 检查 索引 idx 是 
de 因为 断言 会 处 理 它们 。 如 果 调 试 程序 的 时 候 一 个 “不 
可 能 ”的 情况 发 生 了 ， 马 上 就 会 出 现 诊 断 信息 。 因 此 程序 不 会 兢 兢 碰 磁 地 运 
i 在 以 后 也 不 会 产生 其 他 的 问题 。 


请 注意 ， 这 不 是 编写 产品 代码 的 最 好 方式 。 实战 中 程序 异常 终止 绝 非 明 
智之 举 。 无 论 相 伴 而 产生 的 提示 信息 对 程序 员 多 么 有 用 ， 它 对 用 户 都 是 天 书 。 
某 种 形式 的 错误 恢复 才 应 该 是 首选 的 方案 。 任 何 诊断 信息 应 该 都 能 被 用 户 
理解 。 


我 们 所 需要 的 是 这 样 一 种 方式 ， 断 言 只 在 调试 程序 的 时 候 起 作用 。 这 样 
从 一 开始 就 可 以 记录 下 需要 的 断言 ， 让 它们 帮助 尽早 发 现 那些 最 糟 的 逻辑 错 
误 。 稍 后 ， 可 以 加 些 代码 来 从 程序 执行 时 发 生 的 错误 中 恢复 。 我 们 希望 这 些 
断言 作为 文档 保留 下 来 ， 同 时 又 不 希望 它们 产生 代码 。 

«assert.h» 正好 提供 了 这 种 行为 。 我 们 可 以 通过 在 程序 的 某 些 地 方 定 
XX NDEBUG 来 改变 assert 的 展开 方式 。 如 果 程 序 中 某 个 包含 <assert.h> 
的 地 方 没 有 定义 NDEBUG， 该 头 文件 就 会 将 宏 assert 定义 为 活动 形式 ， 它 就 
可 以 展开 为 一 个 表达 式 ， 测 试 断言 并 在 断言 为 假 的 时 候 输 出 一 条 错误 信息 ， 
然后 程序 终止 。 反 之 ， 如 果 定 义 了 NDEBUG， 头 文件 就 会 把 这 个 宏 定 义 为 不 执 
行 任何 操作 的 静止 形式 。 
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<assert.h> 


12 ChRENAS 


<assert .h> 


assert 


7.2 诊断 «assert.h» 
头 文件 <assert.h> jf X. T # assert， 还 引用 了 另 一 个 宏 ; 
NDEBUG 


后 者 不 是 <assert.h> 定义 的 。 如 果 NDEBUG 在 包含 了 «assert.h» 的 源 文件 中 某 处 被 定义 
HRA, WAR assert 就 被 直接 定义 为 : 


#define assert(ignore) ((void) 0) 
E assert 应 该 作为 一 个 宏 而 不 是 一 个 实际 的 函数 来 实现 。 如 果 为 了 访问 一 个 实际 的 
函数 而 禁止 了 宏 定 义 ， 那 么 这 种 行为 是 未 定义 的 。 
7.2.1 程序 诊断 
7.2.1.1 £ assert 
概述 


#include <assert.h> 
void assert (int expression); 


说 明 

È assert 向 程序 中 加 人 诊断 。 当 它 执行 的 时 候 ， 如 果 表 达 式 为 假 (就 是 说 和 0 相 
4$), assert 宏 就 按照 实现 定义 的 格式 向 标准 错误 文件 写 人 关于 这 个 特定 调用 的 失败 信息 
(包括 参数 的 文本 、 源 文件 的 名 字 和 源 文本 行 数 一 一 后 面 两 者 分 别 是 预定 义 的 宏 FILE fil 
LINE 的 值 ) ”， 然 后 它 调用 abort 函数 。 

返回 值 

宏 assert 没有 任何 返回 值 。 

SN: abort 函数 (7.10.4.1). 

脚注 

97. 写 人 的 信息 可 能 具有 以 下 形式 : 


Assertion failed: expression, file xyz, line nnn 


1.3 <assert.h> 的 使 用 


在 本 章 的 开头 有 一 个 使 用 宏 assert 的 例子 。 无 论 assert 是 活动 的 还 是 
静止 的 ， 它 的 行为 本 质 上 都 像 是 接受 一 个 int 参数 而 返回 一 个 void 类 型 结果 
的 函数 。 该 宏 的 参数 表面 上 是 一 个 整 型 表达 式 。 如 果 表 达 式 的 值 为 零 ， 宏 就 
会 写 出 一 条 信息 并 终止 程序 的 执行 。 


实际 编写 的 参数 是 一 个 谓词 一 一 一 个 真 〈 非 零 ) REBR F) 的 表达 式 。 
TE for. if # while 语句 中 写 人 这 些 谓词 来 判断 程序 中 的 控制 流 。 一 个 断言 可 
以 简写 为 : 
if (! okay) 
abort (3; 


Bill abort 在 头 文件 <stdlib.h> 中 声明 ， 当 程序 某 些 地 方 出 错 的 时 候 ， 
可 以 调用 该 函数 来 终止 程序 的 执行 。 
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Z: NDEBUG 


make 文件 


良性 重 定义 


断言 可 以 帮助 记录 代码 所 作 的 假设 ， 在 调试 代码 的 时 候 ， 它 们 也 提供 了 
那些 假设 的 人 口 。 然 而 ， 前 面 我 就 强调 过 ， 一 个 产品 程序 不 能 这 样 突然 间 终 
止 。 无 论断 言 在 调试 的 时 候 多 么 方便 ， 最 终 它 们 都 是 多 余 的 。 


怎样 控制 宏 的 展开 方式 不 过 是 个 风格 问题 。 但 是 必须 通过 某 种 方式 来 控 
制 宏 NDEBUG 是 否定 义 。 一 种 编程 方式 是 修改 源 代 码 。 如 果 你 认为 断言 没有 
存在 的 必要 ， 则 只 需 在 包含 头 文件 之 前 加 上 下 面 的 代码 就 可 以 了 : 

#define NDEBUG /* disable assertions */ 

#include «assert.h» 

这 段 代码 清楚 地 说 明了 断言 从 此 不 再 起 作用 。 而 当 退 回来 重新 调试 的 时 
候 ， 它 唯一 的 缺陷 就 会 显露 出 来 。( 我 敢 保证 一 定 会 出 现 这 种 情况 。 ) 此 时 必 
须 重新 编辑 源 文件 来 移 除 该 宏 定义 。 


很 多 编译 器 都 支持 一 种 更 灵活 的 方法 。 它 们 允许 在 任意 C 源 文 件 之 外 定 
义 一 个 或 多 个 宏 。 可 以 在 一 个 命令 脚本 或 重建 程序 文件 的 make 文件 中 指定 
这 些 定 义 。 在 那里 定义 NDEBUG 和 说 明 断 言 无 效 更 好 。 在 必须 重新 加 到 一 个 
更 原始 的 调试 阶段 的 时 候 ， 它 也 是 一 个 更 容易 复制 和 修改 的 文件 。C 标准 没 
有 对 这 样 的 功能 作 任何 要 求 ， 但 实现 者 在 设计 <assert .h> 的 时 候 还 是 考虑 
到 了 这 一 点 。 


这 个 头 文件 有 个 额外 的 特性 。 就 像 在 前 面 的 章节 提 到 的 那样 ， 所 有 其 他 的 
头 文件 都 具有 寡 等 性 。 包 含 它们 中 的 任意 一 个 两 次 或 者 更 多 次 ， 与 包括 一 次 共 
有 完全 相同 的 效果 。 但 对 <assert .h> 来 说 ， 每 次 包含 它 的 时 候 它 的 行为 都 
会 变化 。 该 头 文件 会 改变 assert 的 定义 来 适应 NDEBUG 当前 的 定义 状态 。 


因而 实际 的 效果 是 你 可 以 在 整个 源 文件 中 用 不 同 的 方式 控制 断言 。 例 
如 ， 当 断言 在 频繁 执行 的 循环 内 部 发 生 时 ， 性 能 可 能 会 急剧 下 降 。 或 者 在 到 
达 提 示 性 的 部 分 之 前 ， 一 个 更 早 的 断言 可 能 会 终止 程序 。 不 管 哪 种 情况 ， 都 
需要 在 一 个 源 文 件 中 各 个 不 同 的 地 方 打 开 或 者 关闭 断言 。 


所 以 要 打开 断言 ， 可 以 写 : 


#undef NDEBUG 
#include «assert.h» 


BKB a, WAS: 


#define NDEBUG 
#include <assert.h> 


ÆR: BE NDEBUG 已 经 被 定义 了 ， 我 们 仍然 可 以 安全 地 定义 它 。 正 
如 0.4 节 所 说 的 ， 这 是 一 个 良性 重 定义 。 在 标准 C 中 添加 良性 重 定义 就 是 这 
个 且 的 。 在 有 宏 保护 和 条 件 语句 的 情况 下 ， 就 不 用 再 防止 宏 的 多 次 定义 了 。 
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<assert.h> 


1.4 <assert.h> 的 实现 


良性 取消 定义 


STR 


这 个 头 文件 需要 的 代码 很 少 ， 但 必须 非常 细心 地 完成 。 为 了 对 NDEBUG 


做 出 正确 回应 ， 该 头 文件 一 定 要 有 一 个 总 体 结构 : 


#undef assert /* remove existing definition */ 
#ifdef NDEBUG 

#define assert (test) ((void) 0) /* passive form */ 
#else 

#define assert (test) ... /* active form */ 
#endif 


如 果 当 前 宏 assert 的 定义 不 存在 ， 那 么 开头 的 #undef 预 处 理 指令 也 没 


有 任何 副作用 。 总 是 可 以 tundet 一 个 名 字 ， 不 论 它 是 不 是 被 定义 为 一 个 宏 。 
(可 以 把 这 作为 良性 取消 定义 考虑 。) 但 是 ， 如 果 和 定义 可 能 改变 的 话 ， 这 条 预 
处 理 指 令 还 是 很 有 必要 的 。 


针 。 
码 。 


一 个 简单 地 编写 宏 的 活动 形式 的 方式 是 : 


#define assert (test) if (!(test)) V 
fprintf (stderr, "Assertion failed: %s, file %s, line %i\n", \ 
#test, _ FILE , __LINE__) /* UNACCEPTABLE! */ 


这 种 方式 因为 各 种 各 样 的 原因 而 不 能 接受 : 


O 宏 不 能 直接 调用 库 的 任何 输出 函数 ， 例 如 fprintf。 它 也 不 能 引用 宏 
stderr。 这 些 名 字 只 能 在 头 文件 «stdio.h» 中 正确 地 声明 或 者 定义 。 
程序 可 能 没有 包含 这 个 头 文件 ， 但 «assert.h» 一 定 不 能 包含 。 一 个 
程序 如 果 不 包含 某 个 头 文件 ， 就 可 以 定义 宏 来 对 该 头 文件 中 的 任意 名 
字 重新 命名 。 这 就 要 求 这 个 宏 必 须 调用 一 个 具有 隐藏 名 字 的 函数 来 进 
行 实际 的 输出 。 

O 宏 必须 能 扩展 为 一 个 void 类 型 的 表达 式 。 例 如 程序 能 包含 一 个 形 如 
(assert (0<x) ,x<y) 的 表达 式 ， 这 就 不 能 使 用 tr 语句 了 。 任 何 测试 
都 要 在 一 个 表达 式 内 部 使 用 某 个 条 件 操 作 符 。 

D 宏 应 该 可 以 扩展 为 有 效 并 且 紧 凑 的 代码 。 和 否则， 程序 员 就 会 尽量 避免 
使 用 断言 。 而 这 个 版 本 却 总 是 调用 一 个 传递 了 5 个 参数 的 函数 。 

图 1-1 显示 了 文件 assert.h。 宏 assert 的 这 种 实现 方法 履行 了 测试 方 

通过 这 种 方式 ， 一 -个 优化 的 翻译 器 大 都 能 清除 明显 正确 的 断言 的 所 有 代 

这 个 宏 以 xyz:nnn 表达 式 (使 用 C 标准 的 符号 ) 的 形式 把 诊断 信息 添加 


到 一 -个 字符 串 参 数 中 。 字 符 串 创建 操作 符 #x 对 大 多 数 信息 编码 ， 然 后 字符 
串 拼 接 程 序 把 这 些 片断 合并 到 一 起 。 由 于 使 用 了 file line, Xie C 标准 
建议 的 方式 更 紧凑 。 


一 个 令 人 讨厌 的 问题 是 内 置 宏 LINE 没有 扩展 成 字符 串 字 面 量 ， 它 


van 变 成 了 一 个 十 进 制 常量 。 把 它 转 换 为 适当 的 形式 需要 一 个 额外 的 处 理 层 。 那 
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图 1-1 


assert.h 


Å Assert 


Æ 1-2 


xassert.c 


前 向 引用 


要 通过 向 头 文件 中 添加 两 个 隐藏 的 宏 STR A VAL 来 实现 。 其 中 一 个 宏 用 
它 的 十 进 制 常 量 扩展 来 取代 .LINE _， 另 一 个 是 把 十 进 制 常量 转换 为 一 个 
字符 串 字 面 量 。 忽 略 STRA VAL 中 的 任何 一 个 ， 就 会 得 到 字符 串 字面 量 
"LINE “"， 而 不 是 你 想 要 的 结果 。 


/* assert.h standard header */ 
#undef assert /* remove existing definition */ 


#ifdef NDEBUG 
#define assert(test) ((void)0) 
felse /* NDEBUG not defined */ 
void Assert (char *); 
/* macros */ 
#define _STR(x) _VAL(x) 
#define _VAL(x) #x 
#define assert (test) ((test) ? (void) 0 \ 
: _Assert ( FILE "i" STR( LINE )"" ftest)) 
fendif 


图 1-2 显示 了 文件 xassert.c. "EXE XY AVA AGE RÅ Assert, 
一 个 巧妙 的 Assert 函数 能 解析 诊断 信息 ， 也 能 补充 缺少 的 位 数 。 这 里 给 出 
的 版 本 不 能 提供 这 些 功 能 ， 因 为 那些 精确 的 信息 格式 是 实现 定义 的 。 


/* Assert function */ 
finclude <assert.h> 
include <stdio.h> 
#include <stdlib.h> 


void _Assert(char *mesg) 
{ /* print assertion message and abort */ 
fputs(mesg, stderr); 
fputs(" -- assertion failed\n", stderr); 
abort(); 
} 


函数 Assert 使 用 了 两 个 其 他 的 库 函 数 。 它 通过 调用 <stdio.h> 中 声明 
的 函数 fputs 把 字符 串 写 到 标准 错误 流 ， 通 过 调用 <stdlib.h> 中 声明 的 函 
数 abort 异常 终止 程序 的 执行 。 有关 这 些 头 文件 的 描述 会 在 较 后 面 的 章节 出 
现 。 如 果 你 对 C 有 一 个 大 体 的 了 解 ， 看 这 些 前 向 引用 应 该 没什么 问题 。 但 是 
如 果 你 需要 进一步 了 解 这 部 分 的 函数 的 功能 ， 你 必须 跳 过 很 多 页 。 


一 个 好 的 入 门 指南 会 把 这 些 提前 用 到 的 知识 的 难度 减 到 最 小 。 但 是 ，C 
标准 库 是 高 度 相互 联系 的 。 几 乎 每 一 部 分 的 实现 都 以 其 他 部 分 为 依据 而 且 只 
能 依据 其 他 部 分 来 描述 ， 就 像 我 对 fputs 和 abort 的 做 法 一 样 。 当 我 必须 提 
前 提 及 的 时 候 ， 我 用 一 般 的 说 法 来 表达 这 些 新 内 容 。 这 会 让 新 接触 标准 C 的 
读者 尽量 少 翻 来 翻 去 ， 但 是 恐怕 不 能 完全 做 到 。 
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1.5 «assert.h» 的 测试 
图 1-3 显示 了 文件 assert.c。 这 个 测试 程序 通过 4 种 不 同 的 方式 测试 


图 1-3 


tassert.c 


VE assert 


以 它 的 静止 和 活动 形式 ， 包 括 满 足 测 试 条 件 和 不 满足 测试 条 件 


的 情况 。 只 有 不 满足 测试 条 件 的 活动 形式 才 应 该 终止 。 正 确 的 程序 执行 应 该 


显示 类 似 下 面 的 东西 ， 


Sample assertion failure message -- 


TASSERT.C:43 val == 0 -- assertion failed 


SUCCESS testing <assert.h> 


并 且 能 正常 终止 。 然 而 ， 注 意 ， 程 序 输出 文本 到 标准 错误 流 和 标准 输出 流 。 文 


本 行 在 不 同 的 实现 中 可 以 按 不 同 的 顺序 出 现 。 


/* test assert macro */ 
#define NDEBUG 
*include «assert.h» 
#include <signal.h> 
#include <stdio.h> 
#include <stdlib.h> 


/* static data */ 
static int val = 0; 


Static void field_abort(int sig) 
{ 
if (val == 1) 
{ 


puts ("SUCCESS testing <assert. 


exit (EXIT SUCCESS); 
) 

else 
{ 


exit (EXIT_FAILURE) ; 
} 
} 


static void dummy () 
{ 
int i = 0; 
assert(i == 0); 
assert(i == 1); 
} 


#undef NDEBUG 


#include <assert.h> 


int main() 
{ /* test both dummy and working forms */ 
assert (signal (SIGABRT, &field_abort) != SIG ERR); 
dummy () ; 
assert (val == 0); /* should not abort */ 
++val; 


fputs("Sample assertion failure message --An", stderr); 


assert(val == 0); 


puts("FAILURE testing «assert. h»"); 


return(EXIT FAILURE); 
) 


puts("FAILURE testing «assert. 


《参照 第 12 章 关于 流 的 讨论 。) 


/* handle SIGABRT */ 


/*expected result */ 
ho"); 


/* unexpected result */ 
h>"); 


/* test dummy assert macro */ 


/* should abort */ 
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如 果 前 面 提 到 的 assert 的 3 次 调用 中 的 任何 一 个 导致 程序 异常 终止 ， 
或 者 程序 正常 退出 并 返回 EXIT FAILURE (<stdlib.h> 中 定义 的 一 个 非 零 值 ) 
的 状态 报告 ， 测 试 就 会 失败 。 


tassert.c 是 一 个 相当 成 熟 的 测试 程序 。 它 使 用 的 函数 中 有 两 个 和 我 们 
见 过 的 函数 差不多 。 程 序 通过 调用 <stdio.h> 中 声明 的 函数 puts 把 串 写 到 
标准 输出 流 ， 通 过 调用 <stdlib.h> 中 声明 的 aport 来 正常 终止 程序 。 然 而 ， 
程序 的 功能 不 止 这 些 。 它 通过 调用 <signal.h> 中 的 signal, # Assert if 
用 abort 之 后 重新 获得 控制 权 。 它 甚至 使 用 宏 assert 来 验证 signal 返回 了 
正确 的 状态 。 想 象 一 下 使 用 要 测试 的 机 器 来 实现 测试 工具 ! 那 简直 不 是 调试 
新 代码 的 方法 。 


事实 上 ， 这 不 是 我 调试 代码 的 方式 。 我 的 第 一 个 版 本 的 rassert.c ER 
assert 第 四 次 测试 的 时 候 就 以 失败 告终 。 我 承认 走 到 那 一 步 已 经 进行 了 几 次 
尝试 。fputs 和 signal 都 适用 于 很 多 机 器 ， 我 开始 测试 <assert.h> 时 并 没 
有 在 所 有 这 些 机 器 上 进行 调试 。 为 了 一 次 又 一 次 调试 代码 方便 ， 我 不 得 不 引 
和 人 程序 柱 (一 个 简单 得 多 的 版 本 )。 调 试 的 必要 性 和 简单 的 可 靠 性 测试 的 必要 
性 有 很 大 的 不 同 。 当 其 中 的 一 个 测试 失败 的 时 候 ， 你 必须 要 改变 它 (或 者 依 
靠 一 个 交互 的 编译 器 的 服务 〉 来 准确 地 找到 出 错 的 位 置 。 这 是 我 为 了 保持 测 
试 简洁 所 做 的 设计 妥协 之 一 。 
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17 ”习题 


1.2 


1.4 


两 本 提倡 用 断言 编程 的 好 书 是 : 


O.J. Dahl, E.W. Dijkstra, and C.A.R. Hoare, Structured Programming (New 
York: Academic Press, 1972). 


E.W. Dijkstra, A Discipline of Programming (Englewood Cliffs, N.J.: 
Prentice-Hall, Inc., 1973). 


尽管 这 两 本 书 都 出 版 了 很 长 时 间 ， 但 它们 仍然 很 受 关注 。 


使 用 图 1-2〈 图 中 的 格式 与 C 标准 中 的 格式 完全 一 致 ) 中 xassert.c 的 版 本 
编写 assert.h 的 一 个 版 本 。 


使 用 图 1-1. 《图 中 的 格式 与 C 标准 中 的 格式 完全 -一致 ) 中 assert -h 的 版 本 编 
EG xassert.c 的 一 个 版 本 。 


上 面 两 个 练习 的 方法 有 什么 相关 优点 ? 


写 出 assert.h 和 xassert.c 的 一 个 版 本 ， 要 求 能 打印 出 所 有 断言 。 你 为 什 
么 想 使 用 该 版 本 ? 


<assert.h> 


{ 难 ] 写 一 个 处 理 控 制 信号 SIGABRT 的 程序 ， 该 信号 输出 以 下 提示 信息 : 
Continue (y/n)? 到 标准 错误 流 ， 并 从 标准 输入 流 读 和 响应。 如 果 响 应 是 yes 
(大 小 写 都 可 以 )， 处 理 程序 应 该 使 自己 复位 ， 并 把 控制 权 还 给 abort FK. 
(第 9 章 描 述 信号 ， 第 13 章 描述 abort 函数 。) 


为 什么 希望 使 用 这 种 功能 ? 


[ 难 ] 写 一 个 处 理 控制 信号 SIGABRT 的 程序 ， 该 信号 在 main 函数 的 顶部 执行 
一 个 longjmp 到 一 个 setjmp。( 第 8 章 描述 longjmp 和 setjmp MÅ. ) 

为 什么 希望 使 用 这 种 功能 ? 描述 一 种 安全 的 规则 ， 该 规则 为 使 用 这 种 功能 的 

程序 初始 化 一 个 静态 存储 空间 。 


[ 很 难 ] 一 些 C 翻译 器 提供 一 个 源 文件 级 的 交互 式 调试 器 。 这 样 的 调试 器 通常 
允许 你 在 正在 执行 的 程序 中 的 各 个 地 方 设置 条 件 断 点 。 找 一 个 这 样 的 C 翻译 
器 ， 探 索 一 下 需要 什么 条 件 才 能 使 <assert .ph> 在 这 样 的 调试 器 下 工作 。 目 
标 是 按照 难度 递增 的 顺序 ): 


论 什么 时 候 断 言 出 错 ， 都 要 把 控制 权 回 交 给 调试 器 。 遇 到 符合 宏 as- 
sert 的 令 人 讨厌 的 调用 语句 时 ， 程 序 能 够 继续 执行 
O 不 让 宏 assert 产生 内 联 代码 。 相 反 地 ， 它 应 应 该 传递 指令 到 源 文件 级 的 调 
试 器 。 
O TEE assert 是 否 出 现 
的 代码 。 
O 实现 一 个 改进 的 宏 assert， 它 可 以 接受 任意 复杂 度 的 测试 表达 式 。 


为 什么 希望 使 用 以 上 每 一 个 功能 ? 


不 论 它 是 活动 的 还 是 静止 的 ， 生 成 最 优 级 别 
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惯用 法 


字符 处 理 从 C 发 展 的 早期 开始 就 很 重要 了 。 那 时 很 多 人 被 DEC 数字 设 
备 公司 ) PDP-11 丰富 的 字符 操作 指令 集 所 吸引 。 当 Ken Thompson 把 UNIX 
移植 到 PDP-11/20 时 ， 他 给 我 们 提供 了 一 种 优秀 的 工具 来 以 统一 的 方式 操作 
字符 流 。C 出 现 以 后 ， 当 编写 具有 强大 字符 处 理 功能 的 程序 时 ，C 自然 就 成 
了 首选 的 语言 。 

这 是 一 种 全 新 的 程序 设计 风格 。C 程序 趋向 于 短小 且 致 力 于 单一 功能 的 
编写 。 在 这 之 前 的 传统 是 编写 提供 很 多 服务 的 大 工程 。C 程序 可 以 读 人 和 写 
出 人 类 易 读 取 的 字符 流 ， 之 前 是 通过 高 度 结构 化 的 二 进 制 文件 进行 程序 间 的 
通信 。 它 们 利用 附带 的 回 车 控制 ‘(embedded carriage control) 产生 标 页 数 的 
报告 来 向 人 们 提供 信息 。 

早期 在 UNIX 下 用 C 编写 的 工具 很 快 就 形成 了 很 多 惯用 法 。 我 们 经 常 将 
字符 排序 并 分 成 不 同 的 类 别 。 为 了 识别 一 个 字母 ， 可 以 编写 : 


if (‘A' <= c && c <= "äi || 'a' <= c && c <= 'z') 


当 执 行 字符 集 是 ASCII 83. (ASCII & “American Standard Code for Information 

Interchange《〈 美 国标 准 信息 交换 码 )” 的 缩写 。 它 是 一 种 使 用 广泛 的 字符 编 

码 ， 但 并 不 是 所 有 的 体系 结构 都 使 用 它 。 因 此 这 种 惯用 法 就 不 适用 于 其 他 常用 

的 字符 集 ， 例 如 IBM 的 EBCDIC) 时， 执行 上 述 代 码 就 可 以 得 到 正确 的 结果 。 
为 了 判别 一 个 数字 ， 可 以 编写 : 


if ('0' <= c && C <= '9") 


为 了 判别 空白 ， 可 以 编写 : 


if (c == '' [| c = Ve ie =='Wn') 


很 快 ， 我 们 的 程序 因 充斥 着 类 似 这 样 的 判断 语句 而 变 长 ， 尤 其 在 几乎 全 
部 是 这 种 判断 语句 的 情况 下 ， 程 序 变 得 很 长 。 我 们 也 可 以 用 一 些 其 他 方式 来 
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字符 类 别 


实现 上 述 惯用 法 ， 但 那样 更 不 容易 理解 并 且 发 生 错 误 的 几率 更 大 。 


对 于 某 些 字符 分 类 方法 也 可 以 有 多 种 选择 。 比 如 空格 就 受 困 于 它 众 所 周 
知 的 多 变性 。 你 可 以 将 垂直 制 表 符 和 水 平 制 表 符 及 空格 混用 吗 ? 如 果 使 用 换 
行 符 《实际 上 是 ASCII 换行 )， 也 应 该 包含 回 车 符 (UNIX 保留 的 用 来 输出 一 
行 写 满 后 的 换行 ) 吗 ? 那么 怎么 处 理 换 页 ? 要 想 让 各 种 工具 能 在 一 起 协调 工 
作 ， 就 要 使 它们 遵守 共同 的 规则 。 


我 们 很 自然 想到 的 方法 是 ， 引 入 咀 数 来 代替 这 些 判 断 语句 。 这 使 它们 立 
即 变 得 更 具 可 读 性 、 更 一 致 、 更 容易 适应 执行 字符 集中 的 变化 。 于 是 ， 上 面 
的 惯用 法 就 变 成 了 : 


if(isalpha(c)) 
if(isdigit(c)) 
if(isspace(c)) 


— BAR REE PRR, tri EHR KK. ETRIREA T 
正在 成 长 的 C Pr Sc RAY PRUE. BE AER AF D E A EE PR, MAHE 
重复 构造 他 们 自己 的 惯用 法 。 这 些 字符 分 类 函数 非常 有 用 ， 也 特别 优秀 ， 人 
们 甚至 开始 怀疑 这 是 不 是 幻觉 。 


过 去 ， 它 们 确实 很 好 。 一 个 典型 的 文本 处 理 程序 对 输入 流 中 的 每 个 字符 
会 平均 调用 3 次 这 样 的 函数 。 因 为 这 样 的 函数 太 多 .了 ， 所 以 调用 它们 经 常 决 
定 着 程序 的 执行 时 间 。 这 就 导致 一 些 程序 员 尽 量 避 免 使 用 这 些 标 准 字符 分 类 
函数 。 进 而 ， 其 他 的 一 些 程序 员 就 开发 了 一 些 宏 来 代替 这 些 函 数 。 


C 程序 员 更 喜欢 宏 。 因 为 宏 可 以 让 程序 员 编写 出 和 函数 调用 一 样 可 读 但 
效率 更 高 的 代码 。 不 过 ， 要 警惕 一 些 意外 情况 : 


O 虽然 宏 可 能 比 珊 数 调 用 执行 得 快 ， 但 它 展开 后 的 代码 可 能 会 比 函 数 调 

用 的 多 几 倍 。 如 果 你 的 程序 在 很 多 地 方 扩展 宏 ， 这 个 程序 可 能 大 得 让 
RIKER 

O 宏 可 能 会 展开 为 一 个 子 表达 式 ， 但 它 不 像 函数 调用 那样 捆绑 得 那么 紧 
凑 。 这 是 不 能 接受 的 ， 但 又 是 经 常 发 生 的 。 在 宏 定义 中 使 用 圆 括号 可 
以 消除 这 种 弊端 。 

D 宏 展开 后 ， 某 些 参数 可 能 执行 了 不 止 一 次 ， 或 者 根本 就 不 执行 。 一 个 
具有 副作用 的 宏 参 数 会 导致 意外 的 发 生 。 虽 然 一 些 C 程序 员 认 为 这 
样 的 意外 可 以 接受 ， 但 现代 编程 习惯 还 是 避免 使 用 它们 。 只 有 两 个 C 
标准 库 函 数 getc 和 pute (都 在 <stdio.h> 中 声明 )， 使 用 时 可 能 会 
产生 这 种 不 安全 行为 的 宏 。 
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转换 表 


区 域 设置 


所 以 ， 在 那些 日 子 里 ， 最 大 的 挑战 就 是 编写 一 个 宏 的 集合 来 代替 这 些 
字符 分 类 函数 。 因 为 使 用 范围 很 广 ， 所 以 它们 展开 后 要 很 紧凑 。 当 然 ， 使 用 
的 时 候 也 要 相当 安全 。 和 久而久之， 这 些 宏 就 演化 成 了 使 用 一 个 或 多 个 转换 表 
(translation table〉 的 宏 集合 ， 每 个 宏 都 有 以 下 形式 : 

#define XXXMASK Ox... 

#define isxxx(c) ( Ctyptab[c] & _XXXMASK) 

字符 c 编 人 以 Ctyptab 命名 的 转换 表 索 引 中 。 每 个 表 项 的 不 同位 以 索 
引 字符 为 特征 。 如 果 任 何 一 个 和 掩 码 _XxxMASK 相对 应 的 位 被 设置 了 ， 那 个 
字符 就 在 要 测试 的 类 别 中 。 对 所 有 正确 的 参数 ， 宏 展开 成 一 个 紧凑 的 非 零 表 
达 式 。 

这 种 方法 的 弊端 是 对 某 些 错误 的 参数 ， 宏 会 产生 错误 的 代码 。 如 果 一 个 
宏 的 参数 不 在 它 的 定义 域内 ， 那 么 执行 这 个 宏 时 ， 它 就 会 访问 转换 表 之 外 的 
存储 空间 。 这 种 错误 可 能 会 一 直 隐 藏 而 不 被 发 现 ， 也 可 能 会 终止 程序 的 执行 ， 
返回 一 个 模糊 的 信息 ， 这 都 取决 于 具体 的 实现 。 


这 些 图 数 假设 它们 测试 的 值 是 函数 fgetc、fputc、getc、getchar、 
putc, putchar 和 ungetc (都 在 <stdio.h> HÆR) 中 某 一 个 的 返回 值 。 
所 有 这 些 孔 数 都 返回 一 个 转换 为 unsigned char 类 型 的 字符 代码 一 一 一 个 很 小 
的 非 负 值 ， 或 者 返回 宏 EOF 的 值 ， 该 宏 在 <stdio.n 中 声明 ， 是 一 个 负 值 
〈 通 常 是 -1)。 


在 char 类 型 和 signed char 类 型 表示 含义 相同 的 计算 机 体系 结构 下 ， 当 
测试 那些 比较 生僻 的 字符 代码 时 ， 就 会 发 生 一 个 常见 的 错误 。 函 数 调 用 
isprint(c) 看 起 来 很 安全 。 但 是 若 CH char 类 型 ， 而 且 符号 位 被 置 位 ， 那 
么 参数 会 是 一 个 负 值 ， 该 值 基本 上 是 在 函数 的 定义 域 之 外 。 


几乎 没有 程序 员 会 编写 isprint((unsigned char)jc)， 虽 然 它 更 安全 。 
当然 ， 在 确认 参数 值 EOF 不 会 出 现 的 地 方 ， 也 可 以 安全 地 使 用 强制 类 型 转换 。 


然而 ， 转 换 表 仍 然 是 很 多 字符 分 类 函数 的 当今 实现 的 基础 。 它 们 会 为 实 
现 者 提供 高 效 的 宏 ， 即 使 在 多 区 域 设 置 出 现 的 地 方 也 是 如 此 。 区 域 设置 是 一 
个 很 长 的 话题 ， 我 会 在 第 6 章 中 详细 地 讨论 它们 。 

现在 ， 我 只 是 发 现 一 个 C 程序 总 是 在 "Cc" 区 域 设置 中 开始 执行 。 调 用 天 
数 setlocale 可 以 改变 区 域 设置 。 当 区 域 设置 改变 的 时 候 ，<ctype.h> 中 声 
明 的 函数 的 某 些 属 性 就 可 能 改变 它 的 行为 。 

«ctype.h» 中 声明 的 函数 对 当今 的 C 程序 员 来 说 仍然 是 很 重要 的 。 你 会 
在 对 字符 进行 排序 分 类 的 任何 地 方 使 用 这 些 函 数 。 它 们 可 以 让 你 在 各 种 各 样 
的 字符 集中 更 有 可 能 编写 出 既 高 效 又 正确 的 代码 。 
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<ctype.h> | 73 字符 处 理 <ctype.h> 


isalnum 


isalpha 


iscntrl 


isdigit 


isgraph 


头 文件 «ctype. ho 声明 了 几 个 可 以 用 于 识别 和 转换 字符 的 函数 e. 

对 于 所 有 参数 是 int 类 型 的 情况 ， 参 数值 可 以 表示 为 unsigned char 类 型 ， 或 者 和 宏 
EOF 的 值 相等 。 如 果 参 数 为 其 他 的 值 ， 则 它 的 行为 未 定义 。 

这 些 函 数 的 行为 受 当前 区 域 设 置 的 影响 。 当 处 于 "C" 之 外 的 区 域 设置 时 ， 有 些 函 数 的 
某 些 方面 是 由 实现 定义 的 ， 下 面 都 把 这 些 函 数列 了 出 来 。 

打印 字符 〈printing character) 指 的 是 由 实现 定义 的 字符 集 的 一 个 元 素 ， 每 一 个 打印 字 
符 在 显示 设备 上 都 占据 一 个 打印 位 置 。 控制 字符 (control character) 是 实现 定义 的 字符 集 
中 不 是 打印 字符 的 元 素 ”。 

参见 ，EOF (7.9.1)、 区 域 设 置 (7.4)。 
7.3.1 字符 判断 函数 

本 子 句 下 的 函数 当 且 仅 当 参数 c 的 值 和 函数 描述 中 的 一 致 时 才 返 回 非 零 〈 真 )。 
7.3.1.1 函数 isalmm 

概述 


#include <ctype.h> 
int isalnum(int c); 


说 明 

函数 isalnum 判别 所 有 isalpha 或 者 isdigit 判别 为 真 的 字符 。 
7.3.1.2 函数 isalpha 

概述 


#include «ctype.h» 
int isalphafint c); 
说 明 
函数 isalpha 判别 所 有 isupper 或 者 islower 判别 为 真 的 字符 ， 或 者 那些 实现 定义 的 
字符 集中 的 iscntrl, isdigit, ispunct 和 isspace 判别 都 不 为 真 的 字符 。 在 "Cc" KR 
设置 中 ，isalpha 只 对 isupper 或 者 islower 判别 为 真 的 字符 返回 真 。 
7.3.1.3 BR iscntrl 
概述 


finciude «ctype.h» 
int iscntrl(int c); 


说 明 

函数 iscntrl 判别 所 有 的 控制 字符 。 
7.3.1.4 BR isdigit 

概述 


#include «ctype.h» 
int isdigit(int c); 
说 明 
函数 isdigit 判别 所 有 的 十 进 制 数字 字符 〈 见 5.2.1 中 的 定义 )。 
7.3.1.5 函数 isgraph 
概述 


#include: <ctype.h> 
int isgraph(int c); 
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CC 
说 明 
函数 isgraph 判别 除 空格 ('') 之 外 的 所 有 打印 字符 。 
islower | 7.3.1.6 函数 islower 
概述 


#include <ctype.h> 
int islower(int c); 


说 明 
函数 islower 判别 所 有 的 小 写字 母 或 者 实现 定义 的 字符 集中 iscntrl. isdigit, E 
ispunct 和 isspace 判别 都 不 为 真 的 字符 。 在 "C" 区 域 设置 中 ，islower 只 对 定义 为 小 写 
字母 〈 见 5.2.1 中 定义 ) 的 字符 返回 真 。 
isprint | 7.3.1.7 函数 isprint 
概述 


include <ctype.h> 
int isprint(int c); 
说 明 
函数 isprint 判别 包括 空格 ('') 在 内 的 所 有 打印 字符 。 
ispunct | 7.3.1.8 函数 ispunct 
概述 


#include «ctype.h» 
int ispunct(int c); 
说 阴 . 
函数 ispunct 判别 除 空 格 CCO 和 isalnum 判别 为 真 的 字符 之 外 的 所 有 打印 字符 。 
isspace | 7.3.1.9 函数 isspace 
概述 


#include «ctype.h» 
int isspace(int c); 
说 明 
函数 isspace 判别 所 有 标准 的 空白 字符 ， 或 者 由 实现 定义 的 字符 集中 isalnum 判别 为 
假 的 字符 。 标 准 空白 字符 有 : 空格 《'')、 换 页 COME DL BRT CS AF Ce kK 
平 制 表 符 ('\t'〉 MEARKE CwO. TEC" 区 域 设置 中 ，isspace 只 对 标准 空白 字 
FEDA. . 
isupper | 7.3.1.10 函数 isupper 
概述 
#include <ctype.h> 
int isupper(int c); 
说 阴 
函数 isupper 判别 所 有 的 大 写字 母 或 者 实现 定义 的 字符 集中 iscntrl、isdigit、 
ispunct 和 isspace 判别 都 不 为 真 的 字符 。 在 "c" 区 域 设置 中 ，islower 只 对 定义 为 大 写 
字母 〈 见 5.2.1 中 定义 ) 的 字符 返回 真 。 
isxđigit | 7.3.1.11 函数 isxdigit 
概述 


#include «ctype.h» 
int isxdigit(int c); 


说 明 
函数 isxdigit 判别 所 有 的 十 六 进 制 数字 字符 〈 见 6.1.3.2 中 定义 )。 
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7.3.2 字符 大 小 写 转换 函数 
tolower | 7.3.2.1 函数 tolower 
概述 


include <ctype.h> 
int tolower(int c); 
说 明 
函数 tolower 把 一 个 大 写字 母 转换 为 相应 的 小 写字 母 。 
返回 值 
如 果 参 数 是 isupper 判别 为 真 的 字符 ， 并 且 有 一 个 和 它 对 应 的 islower 判别 为 真 的 字 
符 ， 那 么 函数 tolower 就 返回 这 个 对 应 的 字符 , 否则 ， 返 回 原来 的 参数 值 。 
toupper | 7.3.2.2 函数 toupper 
概述 


#include «ctype.h» 
int toupper(int c); 


说 明 

函数 toupper 把 一 个 小 写字 母 转换 为 相应 的 大 写字 母 。 

返回 值 

如 果 参 数 是 islower 判别 为 真 的 字符 ， 并 且 有 一 个 和 它 对 应 的 isupper 为 真 的 字符 ， 

那么 函数 toupper 就 返回 这 个 对 应 的 字符 ， 否 则 ， 返 回 原来 的 参数 值 。 

脚注 

98. 参考 “ 库 的 展望 ”(7.13.2)。 

99. 在 使 用 7 ASCI 字符 集 的 实现 下 ， 打 印字 符 是 指 值 在 0x20〈 空 格 )》 和 0x7E〈 波 
浪 符 ) 之 间 的 那些 字符 ， 控 制 字符 是 指 值 在 0 (NULL) 和 0xlF (US) 之 间 的 那 
些 字 符 和 字符 0x7F (DEL). 


2.3 <ctype.h> 的 使 用 
«ctype.h» 中 声明 的 函数 可 以 用 来 对 字符 进行 判断 和 转换 ， 这 些 字符 由 
fgetc, getc, getchar 等 函数 (ABE <stdio.h> 中 声明 ) BEA. WERA H 
断 它 之 前 存储 了 一 个 这 样 的 值 ， 就 要 声明 这 个 数据 对 象 为 整 型 。 如 果 存 储 的 
是 字符 类 型 ， 那 么 就 会 丢失 一 些 有 用 信息 。 用 户 可 能 会 把 文件 结束 指示 误 认 
为 一 个 有 效 的 字符 。 或 者 可 能 会 把 一 个 有 效 的 字符 代码 转换 为 一 个 负 值 ， 这 
是 不 可 接受 的 。 


.如 果 参 数值 不 是 上 述 几 个 函数 读 和 的， 那么 一 定 要 谨慎 。 这 些 函 数 只 对 
<stdio.h> 中 定义 的 EOF 值 和 unsigned char 类 型 可 以 代表 的 值 正 确 工 作 。 当 
基本 C 字符 集中 的 字符 表示 为 char 类 型 的 时 候 ， 它 们 为 正 值 ， 但 其 他 字符 
可 能 不 是 这 样 。 


对 字符 进行 分 类 并 不 像 看 上 去 那么 简单 。 首 先 ， 必 须 理解 各 种 类 ; 然后 
还 要 知道 某 个 分 类 体系 下 的 所 有 常用 字符 ; 同时 要 了 解 实现 把 那些 不 常用 的 
字符 隐藏 在 了 什么 位 置 ， 还 需要 了 解 把 不 同 的 字符 集 移植 到 一 个 具体 实现 上 
时 ， 所 有 的 一 切 是 怎样 改变 的 ， 最 后 ， 还 要 知道 当 程序 改变 区 域 设 置 的 时 候 ， 
这 些 分 类 是 怎么 改变 的 。 
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Mo <Ctype.h> 的 使 用 31 
字符 分 类 函数 定义 的 字符 类 别 有 以 下 几 种 。 


字符 类 别 


图 2-1 
字符 类 别 


口 
9 


g 


a 


o 字母 


口 
口 


口 


数字 一 一 一 个 '0' 到 '9' 之 间 的 十 进 制 数 。 

十 六 进 制 数字 一 数字， 或 者 字母 表 的 前 6 个 字母 'A' AF mca 
$j't'. 

小 写字 母 一 字母 a 到 z 中 的 一 个 ， 在 "c" 区 域 设 置 外 可 能 会 加 上 其 
他 的 字符 。 

大 写字 母 一 -字母 'A' 到 'z' 中 的 一 个 ， 在 "Cc" 区 域 设 置 外 可 能 会 加 
上 其 他 的 字符 。 

小 写字 母 或 者 大 写字 母 ， 在 "c" 区 域 设置 外 可 能 会 加 上 其 他 


的 字符 。 

字母 数字 一 一 字母 或 者 数字 。 

图 形 字 符 一 一 占据 一 个 打印 位 置 ， 输 出 到 显示 设备 时 可 见 的 字符 。 
标点 符号 一 一 非 字 母 数 字 的 图 形 字 符 ， 至 少 包括 表示 C 源 程序 文本 的 
29 个 符号 。 

AE 


页 名 
Hu. BÆRE CR KERR EI 
置 外 可 能 会 加 上 其 他 的 字符 。 

控制 字符 一 一 是 5 个 标准 的 运动 字符 、 退 格 符 BS 和 警报 符 BEL, Di 
上 其 他 可 能 的 字符 中 的 一 个 字符 。 


这 些 分 类 中 有 两 类 即使 在 "c" 区 域 设 置 中 也 是 没有 边界 的 。 实 现 可 以 
定义 任意 数量 的 附加 的 标点 或 者 控制 字符 。 例 如 ， 在 ASCII 中 ， 标 点 也 包括 
OAS 这 样 的 字符 。 控 制 字 符 包 括 编码 为 十 进 制 的 1 和 31 之 间 的 所 
有 字符 ， 和 编码 为 127 的 删除 符 。 

图 2-1 摘自 Plauger 和 Brodie 的 Standard C。 它 说 明了 字符 分 类 函数 之 间 
的 联系 。 圆 角 和 矩形 中 的 所 有 字符 都 属于 基本 C 字符 集 。 这 是 那些 用 来 表示 任 
意 的 C 源 文件 的 字符 。C 标准 要 求 每 个 执行 字符 集 都 要 包含 所 有 的 这 些 字符 


和 编码 为 0 的 空 字 符 。 
-F a-f 
isxdigit ED 
isdigit 
isalnum < isupper —»( a-z ) 
isalpha < 
isgraph i ve — 
isprint ispunet " 
isspace 
* FF NL CR 
HT VT 


iscntrl 


- (BEL Bs) 
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区 域 设置 
改变 时 


isalnum 


isalpha 


iscntrl 


函数 名 下 有 一 个 加 号 表明 这 个 函数 在 "Cc" 区 域 设置 外 的 区 域 设 置 中 可 以 
表示 附加 的 字符 。 两 个 加 号 表明 这 个 函数 即使 在 "c" 区域 设 置 下 也 可 以 表示 
附加 的 字符 。 


执行 字符 集 也 可 以 包含 其 他 分 类 下 的 字符 。 但 同一 个 字符 只 能 位 于 图 表 
中 的 一 个 位 置 。 如 果 是 小 写字 母 ， 那 么 它 也 可 以 通过 继承 而 属于 多 个 类 。 但 
一 个 字符 不 能 既是 标点 符号 又 是 控制 字符 。 


就 像 从 图 中 看 到 的 那样 ， 几 乎 所 有 的 函数 都 能 在 区 域 设置 变动 的 程序 中 
改变 行为 ， 只 有 isdigit 和 isxdigit 保持 不 变 。 如 果 你 的 代码 想 处 理 区 域 
设置 语言 ， 这 是 个 好 消息 ， 你 就 可 以 使 用 这 两 个 函数 。 例 如 ， 区 域 设 置 会 改 
Æ islower， 来 判别 所 有 额外 的 小 写字 母 。 


然而 ， 如 果 想 让 你 的 代码 不 受 区 域 设置 的 限制 ， 那 么 编程 的 时 候 就 要 更 
加 并 慎 了 。 使 用 字符 分 类 函数 来 增加 任何 测试 ， 以 剿 除 任意 的 不 在 分 类 中 的 
字符 。 或者， 在 程序 改变 它 的 区 域 设置 为 非 "C" 区 域 设置 之 前 ， 去 掉 所 有 独 
立 于 区 域 设置 的 判别 代码 ， 使 它们 不 会 影响 程序 结果 。 


如 果 这 些 方法 都 不 可 行 ， 你 就 可 能 必须 把 区 域 设置 的 一 部 分 或 者 全 部 恢 
复 为 某 个 地 区 的 习惯 ， 可 以 参考 6.3 节 。 


最 重要 的 是 标准 C 开创 了 一 个 新 的 时 代 。 现 在 可 以 更 加 容易 地 编写 出 适 
合 世 界 各 种 文化 的 代码 ， 这 点 是 非常 好 的 。 但 是 现在 写 代码 之 前 必须 作 更 多 
的 计划 。 如 果 它 最 后 作为 一 个 国际 应 用 程序 使 用 ， 某 一 天 它 可 能 会 处 理 到 早 
期 的 C 程序 员 意 想不到 的 字符 。 字 符 分 类 函数 包含 了 这 个 问题 ， 可 以 帮助 处 
理 这 个 问题 ， 而 且 指 出 那些 可 以 改变 的 东西 。 


下 面 ， 我 会 对 <ctype.h> 中 声明 的 每 个 函数 分 别 做 一 些 说 明 。 


isalnum 一 一 “Alinum” 是 “alphanumeric”( 字 母 数字 ) 的 缩写 。 程 序 
寻找 名 字 的 常见 做 法 是 ， 要 求 每 个 名 字 以 字母 开头 ， 但 是 后 面 可 以 是 数字 或 
者 字母 。 经 常 使 用 这 个 函数 来 检查 名 字 的 尾部 字符 。 


isalpha 一 一 “Alpha” 是 “alphabetic”( 字 母 〉 的 缩写 ， 不 区 分 大 小 写 。 
可 以 使 用 这 个 函数 测试 本 地 字母 表 中 的 字母 。 对 于 "C" 区 域 设置 来 说 ， 字 母 
表 总 是 包括 我 们 熟悉 的 26 个 英文 字母 ， 包 括 大 小 写 形式 。 


| 有 些 程序 员 认为 这 个 函数 和 函数 isprint 的 功能 互补 。 当 
然 ， 这 两 个 函数 识别 两 个 不 相交 的 集合 ， 但 是 ， 这 两 个 集合 并 不 一 定 包含 所 
有 的 字符 。 用 这 种 方式 使 用 iscntrl 函数 的 程序 在 遇 到 生僻 字符 的 时 候 会 发 
生 错 误 。 


iscntrl 
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isdigit 


isgraph 


islower 


isprint 


ispunct 


isspace 


isupper 


isxdigit 


在 使 用 这 个 函数 的 时 候 一 定 要 小 心 。 只 有 以 下 7 个 控制 字符 在 所 有 的 区 
域 设置 下 有 统一 的 行为 一 一 报警 、 退 格 、 回 车 、 换 页 、 水 平 制 表 符 、 换 行 和 
垂直 制 表 符 。 一 个 作 了 其 他 假设 的 程序 应 该 用 一 个 显著 的 注释 记录 下 这 些 假 
设 。 


isdigit 


这 是 各 个 区 域 设 置 中 最 稳定 的 函数 之 一 。 它 只 和 基本 C 字 
符 集中 的 10 个 十 进 制 数字 相对 应 ， 而 不 用 管 是 什么 区 域 设置 。( 一 些 字母 表 
为 各 种 各 样 的 数字 提供 了 额外 的 字符 。) 不 仅 如 此 ， 我 们 也 可 以 保证 这 十 个 
数字 的 编码 也 总 是 具有 连续 的 值 ， 就 像 我 们 通常 的 习惯 做 法 那样 〈 没 有 溢出 
KE): 

for (value = 0; isdigit(*s);++s) 

value = value * 10 + (*s -'0'); 

知道 了 这 一 点 ， 就 可 以 依靠 这 种 习惯 用 法 来 简化 那些 实现 数字 转化 的 代码 ， 
并 提高 它们 的 运行 速度 。 

isgraph 一 一 用 来 判别 那些 打印 时 可 以 显示 的 字符 。 该 函数 在 修改 区 域 
设置 的 时 候 会 改变 它 的 行为 。 


islower 一 一 小 写字 母 的 组 成 在 不 同 的 区 域 设 置 中 有 相当 大 的 区 别 。 使 
用 这 个 函数 来 确保 你 能 识别 所 有 的 小 写字 母 。 不 要 认为 每 一 个 小 写字 母 都 有 
对 应 的 大 写字 母 ， 或 者 每 一 个 大 写字 母 都 有 对 应 的 小 写字 母 ， 甚 至 也 不 能 认 
为 字母 只 有 大 写 和 小 写 两 种 形式 。 


isprint 一 这 个 函数 可 以 识别 所 有 输出 到 打印 机 时 占据 一 个 打印 位 置 
的 字符 。 
ispunct 一 一 记 住 ， 标 点 符号 是 一 个 没有 界限 的 字符 集 ， 即 使 在 "Cc" 区 


域 设 置 中 也 是 如 此 。 就 像 C 标准 所 描述 的 那样 ， 你 最 好 认为 标点 符号 属于 图 
形 字 符 ， 而 不 属于 字母 数字 。 


isspace 这 是 一 个 重要 的 函数 。 有 些 库 函数 使 用 isspace 来 判定 把 
哪些 字符 作为 空格 对 待 。 在 "C" 区 域 设 置 中 ， 这 个 函数 用 来 识别 输出 到 显示 
设备 时 ， 所 有 改变 打印 位 置 ， 却 没有 显示 图 形 的 字符 。 你 应 该 认为 isspace 
在 任意 的 区 域 设 置 中 都 是 测试 空格 的 最 好 选择 。 

和 上 面 islower 的 说 明 相 同 ， 只 不 过 功能 相反 。 
和 isdigit 一 样 ， 这 个 函数 也 不 随 着 区 域 设置 而 改变 。 你 
可 以 专门 使 用 它 来 识别 十 六 进 制 数 。 但 是 ， 你 不 能 假设 字母 的 编码 像 数 字 编 


码 那样 是 邻接 的 。 为 了 可 以 在 所 有 的 区 域 设 置 上 对 十 六 进 制 数 进行 转换 ， 你 
可 以 写 : 


isupper 


isxdigit 


34 $23 


tolower 


toupper 


<ctype.h> 


#include <ctype.h> 
#include <string.h> 


static const char xd[] = 
{ "0123456789 abcdefABCDEF"); 
static const char xv[] = 
(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12, 13, 14, 15, 
10, 11, 12, 13, 14, 15}; 


for (value = 0; isxdigit(*s); ++s) 
value = (value << 4) + xv[strchr(xd, *s) - xd]; 


注意 这 些 代码 没有 对 溢出 进行 检查 ， 因 为 那 会 使 这 些 程序 更 复杂 。 


tolower 一 一 这 个 函数 把 大 写字 母 转化 为 小 写字 母 。 它 也 可 以 将 那些 没 
有 大 写 形式 的 字母 和 大 小 写 形式 都 没有 的 字母 处 理 为 小 写字 母 。 不 要 认为 通 
过 简单 的 加 上 或 者 减 去 一 个 常量 就 能 把 大 写字 母 转换 为 对 应 的 小 写字 母 。 虽 
然 那 恰好 适用 于 ASCII 和 EBCDIC 这 两 种 常用 的 字符 集 ， 但 是 C 标准 并 没有 
这 样 要 求 。 


toupper 这 个 函数 把 小 写字 母 转 换 为 大 写字 母 。 它 和 上 面 的 
tolower 有 相同 的 说 明 ， 只 不 过 功能 相反 。 
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取 值 范 围 


这 里 给 出 的 实现 沿用 了 传统 的 方法 。 一 个 转换 表 描述 了 执行 字符 集 的 特 
征 。 每 一 个 函数 把 它 的 参数 作为 表 的 人 口 ， 然 后 这 些 函 数 再 把 选择 的 表 元 素 
和 一 个 唯一 的 掩 码 比 较 来 确定 参数 字符 是 否 在 这 种 正在 讨论 的 类 别 中 。 


若 一 个 转换 表 很 大 ， 那 它 就 没有 什么 意义 了 。 它 的 大 小 是 由 它 包 含 的 元 
素 个 数 和 每 个 元 素 的 大 小 决定 的 。 标 准 C 定义 了 3 种 “字符 ”类 型 char, 
signed char 和 unsigned char。 这 些 类 型 一 定 要 能 表示 执行 字符 集 的 所 有 字符 。 
至 少 要 用 8 位 才能 表示 所 有 的 字符 。 


每 个 字符 分 类 函数 都 接收 一 个 int 类 型 的 参数 ， 但 是 参数 值 都 在 一 定 
的 范围 内 。unsigned char 类 型 所 能 表示 的 所 有 值 都 是 有 效 的 ， 还 有 宏 EOF 
(<stdio.h> PEX) 所 确定 的 值 。 大 部 分 好 的 实现 都 把 BOF 的 值 定义 为 -1。 
本 书 也 不 例外 。 所 以 转换 表 中 元 素 的 数目 一 定 比 字 符 类 型 所 能 表示 的 所 有 字 
符 的 数目 多 1. 


大 部 分 C 实现 严格 地 使 用 8 位 来 表示 一 个 字符 类 型 。 因 此 ， 一 个 转换 表 
一 定 要 包含 257 个 元 素 。 然 而 ， 实 现 可 以 使 用 更 多 的 位 数 。C 已 经 分 别 使 用 
了 9 位 、10 位 、16 位 甚至 32 位 来 表示 字符 类 型 。 而 一 个 转换 表 要 表示 16 位 
字符 类 型 表示 的 所 有 值 是 很 难处 理 的 ， 因 为 它 要 包含 65 537 个 元 素 。 
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tolower 
toupper 


ASCII 和 
ISO 646 


图 2-1 显示 了 8 种 不 同 的 类 别 ， 因 而 转换 表 可 以 是 一 个 unsigned char 类 
型 的 数组 。 但 是 该 图 也 说 明了 这 些 分 类 中 实现 者 可 以 加 入 字符 的 6 个 地 方 
《有 加 号 )。 这 就 说 明 这 个 表 一 定 是 一 个 short 类 型 的 数组 。 我 们 可 以 把 这 些 增 
加 的 字符 加 入 到 现 有 的 分 类 中 。 但 是 ， 至 少 有 两 个 增补 的 字符 集 处 于 "c" 区 
域 设置 之 外 : 


C) 函数 isalpha 可 以 识别 islower 和 isupper 都 不 能 识别 的 字符 。 
O 函数 isspace 可 以 识别 iscntrl 和 isprint 都 不 能 识别 的 字符 。 


我 们 必须 在 以 下 两 种 方法 中 作出 选择 ， 或 者 清除 那些 有 奇异 的 字符 和 空 
格 的 区 域 设置 ， 或 者 使 转换 表 的 每 个 元 素 足 够 大 以 容纳 10 个 分 类 位 。 如 果 想 
支持 拥有 这 些 字母 或 者 空格 字符 的 区 域 设 置 ， 就 要 把 转换 表 声 明 为 一 个 short 
类 型 的 数组 。 然 而 ， 如 果 想 清除 这 些 范围 内 的 值 ， 可 以 通过 把 转换 表 声明 为 
unsigned char 类 型 的 数组 来 节省 空间 。 因 为 实现 的 目标 是 最 大 程度 的 可 移植 ， 
所 以 它 采 用 了 前 者 。 


不 过 ， 有 一 点 是 不 能 忽略 的 。 我 一 直 在 说 一 个 8 位 的 转换 表 的 元 素 应 该 
是 unsigned char 类 型 。 不 是 所 有 的 实现 都 用 2 的 补 码 来 表示 整数 。 在 其 他 的 
表示 方法 中 ， 把 一 个 有 符 导 的 负数 转换 为 无 符号 数 可 能 会 改变 低位 的 值 。 因 
此 ， 在 一 个 有 符号 值 和 一 个 无 符号 掩 码 之 间 进 行 按 位 与 操作 的 时 候 可 能 会 发 
生意 想不到 的 结果 。 


目前 为 止 ， 我 们 假设 字符 用 8 位 《或 者 不 高 于 8 位 ) 表示， 也 假设 了 一 
个 程序 能 够 承担 起 一 个 514 REDET) 字 节 的 转换 表 的 开销 。 为 了 正确 
地 给 出 一 些 实际 的 代码 ， 至 少 还 要 再 做 3 个 假设 。 


假设 1; 字母 转换 函数 tolower 和 toupper 和 这 个 组 中 的 其 他 函数 不 
同 。 它 们 不 是 简单 地 对 参数 进行 分 类 ， 而 是 返回 一 个 可 能 和 参数 字符 不 同 的 
字符 。 因 此 假设 它们 应 该 使 用 和 转换 表 相 似 的 映射 表 来 实现 ， 并 且 这 个 映射 
表 可 以 被 其 他 函数 共享 。 


假设 2; 执行 字符 集 是 在 现代 计算 机 上 广泛 使 用 的 ASCII。 另 一 种 不 同 
的 国际 标准 ISO 646 和 ASCII 有 相同 的 代码 值 和 图 示 符 ， 或 者 字符 的 可 视 形 
式 。 因 此 ，ASCII 中 的 某 些 标点 符号 可 以 被 ISO 646 中 的 图 示 符 代替 。 这 就 
是 欧洲 人 引信 带 重音 的 字符 的 方法 ， 例 如 六 和 8， 而 且 不 用 多 于 7 位 的 编码 。 


这 个 实现 对 那些 没有 把 标点 重新 定义 为 字母 的 ISO 646 的 所 有 变化 形式 
也 是 兼容 的 。 然 而 对 它 做 些 修改 来 适应 ISO 646 的 其 他 形式 是 很 容易 的 。 同 
样 你 可 以 很 容易 地 修改 其 他 字符 集 。IBM 的 EBCDIC 也 要 求 对 表 项 作 些 简单 
改动 。 只 要 保证 表 的 项 和 C 翻译 器 产生 的 字符 常量 (例如 at) 相符 合 就 可 
以 了 。 


<ctype.h> 


可 写 的 
静态 存储 空间 


头 文件 


<ctype.h> 


假设 3: 库 可 以 使 用 指向 表 的 指针 的 可 写 的 静态 存储 空间 。 那 只 支持 一 
种 简单 的 情况 ， 即 翻译 器 必须 包含 C 标准 库 中 的 代码 。 一 旦 包含 在 程序 中 ， 
库 的 代码 就 和 程序 员 提 供 的 代码 具有 相同 的 行为 。 然 而 ， 那 些 可 以 运行 多 个 
程序 的 实现 经 常 可 以 从 共享 库 中 受益 。C 标准 库 中 的 所 有 代码 都 占据 一 个 独 
立 的 内 存 空 间 。 一 个 链接 好 并 在 这 个 环境 中 运行 的 C 程序 把 控制 权 转 移 给 共 
享 库 中 的 耳 数 ， 而 不 是 把 库 中 的 代码 复制 到 自己 的 程序 中 。 这 样 做 的 一 个 明 
显 的 好 处 是 程序 更 小 而 且 链 接 得 更 快 。 


当 一 个 或 者 多 个 函数 需要 维持 一 个 属于 库 私 有 的 可 写 的 静态 数据 对 象 
时 ， 一 个 不 太 明 显 的 此 端 就 浮现 出 来 了 。 我 们 不 能 在 不 同 的 程序 ， 或 者 在 同 
一 个 程序 的 不 同 的 控制 线程 之 间 共 享 一 个 相同 的 数据 对 象 。 我 们 需要 为 每 一 
个 程序 或 者 线程 分 配 一 个 唯一 的 可 写 的 静态 数据 对 象 ， 并 且 要 用 合适 的 初 值 
对 它 进行 初始 化 。 

不 率 的 是 ， 还 没有 一 个 常规 的 方法 来 实现 这 种 功能 。 操 作 系 统 和 连接 器 
使 用 特定 的 机 器 系统 使 共享 库 工 作 。 有 些 直接 禁用 可 写 的 静态 存储 空间 ， 其 
他 的 则 要 求 启用 特定 的 机 器 系统 来 建立 和 访问 可 写 的 静态 存储 空间 。 因 此 ， 
我 们 必须 用 一 种 特殊 的 方式 来 编写 代码 。 


如 果 字 符 分 类 郑 数 需要 适应 区 域 设置 的 改变 ， 它 们 就 需要 可 写 的 静态 存 
储 空间 。 一 种 方法 是 当 区 域 设 置 改变 时 重新 写 表 ， 另 一 个 更 好 的 方式 是 改变 
指向 各 个 〈 只 读 ) 表 的 指针 ， 那 就 加 快 了 区 域 设 置 改变 的 速度 ， 同 时 也 大 大 
减少 了 那些 可 能 需要 特别 处 理 的 可 写 的 存储 空间 。 


这 种 表述 忽略 了 一 个 潜在 的 问题 ， 这 个 问题 跟 库 的 可 写 的 静态 存储 空间 
相 联 系 。 我 尽 可 能 少 用 可 写 的 静态 存储 空间 ， 也 尽力 注意 那些 必须 引入 可 与 
的 静态 数据 对 象 的 代码 ， 但 是 访问 这 些 存 储 空间 时 并 没有 做 特殊 的 标记 。 


图 2-2 显示 了 文件 ctype.h。<ctype.h> 中 声明 的 函数 的 代码 都 是 围绕 
着 3 个 转换 表 构 建 的 。3 个 可 写 的 指针 一 直 指 向 对 应 于 当前 区 域 设置 的 表 。 
注意 ， 每 一 个 函数 都 有 一 个 对 应 的 宏 。 那 些 定义 了 分 类 位 的 宏 名 都 很 星 涩 难 
懂 ， 这 有 助 于 节省 表示 的 空间 。 在 很 多 实现 中 ， 它 也 加 速 了 对 标准 头 文件 的 
处 理 。 


这 些 冰 数 的 代码 看 起 来 很 像 安 。 图 2-3 Cisalnum.c) 到 网 2-15 (toup- 
per.c) 给 出 了 这 些 丽 数 的 代码 。 


图 2-16 显示 了 文件 xtolower.c。 它 定义 了 指针 Tolower 的 初始 值 ， 
也 给 了 伴随 tolower 的 转换 表 的 ASCI 版 本 。 相 似 地 ， 图 2-17 显示 了 文件 
xtoupper.c， 它 定义 了 指针 _Toupper 的 初始 值 和 伴随 toupper 的 转换 表 的 
ASCII 版 本 。 
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图 2-2 
ctype.h 


图 2-3 


isalnum.c 


/* ctype.h standard header */ 
#ifndef | CTYPE 
#define  CTYPE 
/*  Ctype code bits */ 
#define XA 0x200 /* extra alphabetic */ 


#define XS 0x100 /* extra space */ 
#define BB 0x80 /* BEL, BS, etc. */ 
#define | CN Ox40 /* CR, FF, HT, NL, VT */ 
define DI 0x20 /* 'Q'-'9' */ 

#define LO Ox10 /* 'a'-'z' * / 

#define PU 0x08 /* punctuation */ 
#define SP 0x04 /* space */ 

#define UP Ox02 /* 'A'-'Z' */ 


#define XD 0x01 /* 'Q'-'9', 'A'-'"'F', 'a'-'f' */ 
/* declarations */ 
int isalnum(int), isalpha(int), iscntrl(int), isdigit(int); 
int isgraph(int), islower(int), isprint(int), ispunct(int); 
int isspace(int), isupper(int), isxdigit(int); 
int tolower(int), toupper(int); 
extern const short * Ctype, * Tolower, * Toupper; 
/* macro overrides */ 


#define isalnum(c) ( Ctype[(int)(c)] & ( DI| LO| UP| XA)) 
#define isalpha(c) (_Ctype[{int)(c)] & (_LO|_UP|_XA)) 
#define iscntrl(c) (_Ctype[ (int) (c)] & ( BB| CN)) 

fidefine isdigit(c) ( Ctype[(int)(c)] & DI) 

#define isgraph(c) ( Ctype[(int)(c)] & ( DI| LO| PU| UP| XA)) 
#define islower(c) ( Ctype[(int)(c)] & LO) 


#define isprint(c) \ 
(_Ctype[ (int) (c)] & ( DI| ol PU| SP| UP| XA)) 


#define ispunct(c) ( Ctype[(int)(c)] & PU) 
#define isspace(c) ( Ctypel(int)(c)] &( CN|. SP | XS)) 
#define isupper(c) ( Ctype[(int)(c)] & UP) 


#define isxdigit(c) ( Ctype[(int)(c)] & XD) 

#define tolower(c)  Tolower[(int)(c)] 

#define toupper(c) _Toupper[(int) (c)] 

#endif oO 


/* isalnum function */ 
#include <ctype.h> 


int (isalnum) (int c) 


{ /* test for alphanumeric character */ 
return ( Ctypelc] & (_DI | LO |_UP|_XA)); 


} 口 


Kd 2-5 


iscntrl.c 


图 2-6 


isdigit.c 


图 2-7 


isgraph.c 


图 2-8 


islower.c 


图 2-9 


isprint.c 


/* isalpha function */ 
#include <ctype.h> 


int (isalpha) (int c) 


H /* test for alphabetic character */ 
return ( Ctype[c] & ( Lo| UP| XA)); 


H ` 口 


/* iscntrl function */ 
#include <ctype.h> 


int (iscntrl) (int c) 
{ /* test for control character */ 
return ( Ctype[c] & ( BB| CN)); 


) 口 


/* isdigit function */ 
include <ctype.h> 


int (isdigit) (int c) 
{ /* test for digit */ 
return (_Ctype[c] & _DI); 


} 口 


/* isgraph function */ 
#include <ctype.h> 


int (isgraph) (int c) 
{ /* test for graphic character */ 
return ( Ctype[c] & ( DI| LO| PU| UP| XA)); 
) 口 


/* islower function */ 
finclude <ctype.h> 


int (islower) (int c) 
{ /* test for lowercase character */ 
return ( Ctype[c] & LO); 
) 口 


/* isprint function */ 
finclude «ctype.h» 


int (isprint) (int c) 
{ /* test for printable character */ 
return ( Ctype[c] & (_DI|_LO|_PU|_SP|]_UP|_XA)); 
) 口 


图 2-10 
ispunct.c 


图 2-11 


isspace.c 


图 2-12 
isupper.c 


Æ 2-13 
isxdigit.c 


图 2-14 


tolower.c 


2-15 
toupper.c 
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/* ispunct function */ 
#include <ctype.h> 


int (ispunct) (int c) 
{ 
return (_Ctype[c] & _PU); 
} 


/* isspace function */ 
#include <ctype.h> 


int (isspace) (int c) 


{ 


/* test for punctuation character */ 


/* test for spacing character */ 


return (_Ctype[c] & (_CN|_SP|_xS)); 


} 


/* isupper function */ 
ffinclude <ctype.h> 


int (isupper) (int c) 
{ 
return ( Ctype[c] & UP); 
} 


/* isxdigit function */ 
#include <ctype.h> 


int (isxdigit) (int c) 
{ 
return (_Ctype[c] & XD); 
} 


/* tolower function */ 
#include <ctype.h> 


int (tolower) (int c) 
{ 
return (_Tolower[c]); 
} 


/* toupper function */ 
#include <ctype.h> 


int (toupper) (int c) 
{ 
return (_Toupper[c]); 


} 


口 


/* test for uppercase character */ 


n 


/* test for hexadecimal digit */ 


口 


/* convert to lowercase character */ 


口 


/* convert to uppercase character */ 


口 
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图 2-16 


xtolower.c 


/* _Tolower conversion table -- ASCII version */ 
#include <ctype.h> 
#include limite bs 
#include <stdio.h> 


dif EOF != -1 || UCHAR MAX != 255 
#error WRONG TOLOWER TABLE 
#endif 


/* static data */ 

const short tolow_tab[257] = {EOF, 
0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 
0x09, Ox0a, Ox0b, OxOc, Ox0d, Ox0e, 
0x11, 0x12, 0x13, 0x14, 0x15, 0x16, 
0x19, Oxla, Oxib, Oxic, Oxid, Oxle, 
0x21, 0x22, 0x23, 0x24, 0x25, 0x26, 
0x29, Ox2a, 0x2b, Ox2c, 0x2d, Ox2e, 
0x31, 0x32, 0x33, 0x34, 0x35, 0x36, 
0x39, Ox3a, Ox3b, O0x3c, 0x3d, 0x3e, 
‘al, "br, "c, ‘a’, 'et, "EI, 

, j "kr, "lY, 'm", 'n', 
‘p', , à 'S!, ‘el, ‘ul, WA 
'X', , Ox5b, O0x5c, 0x5e, 
0x60, , co, ‘dt, "ei, 4 
"br, i Ir, "kr, ‘he, "m, 'n', 
'D', P 'S', "th, ‘u', tyt” 
"ei, ` , Ox7b, Ox7c, Ox7d, Die, 


. 0x80, 0x82, 0x83, 0x84, 0x85, 0x86, 
0x88, Ox8a, Ox8b, 0x8c, 0x8d, O0x8e, 
0x90, 0x92, 0x93, 0x94, 0x95, 0x96, 
0x98, Ox9a, Ox9b, Ox9c, Ox9d, Ox9e, 
0xa0, Oxa2, Oxa3, Oxa4, 0xa5, Oxa6, 
Oxa8, Oxaa, Oxab, Oxac, Oxad, Oxae, 
Oxb0, Oxb2, 0xb3, Oxb4, 0xb5, Oxb6, 
Oxb8, Oxba, Oxbb, Oxbc, Oxbd, Oxbe, 
OxcO0, Oxcl, Oxc2, Oxc3, Oxc4, Oxc5, Oxc6, 
Oxc8, Oxc9, Oxca, Oxcb, Oxcc, Oxcd, Oxce, 
Oxd0, Oxdl, Oxd2, Oxd3, Oxd4, Oxd5, Oxd6, 
Oxd8, 0xd9, Oxda, Oxdb, Oxdc, Oxdd, Oxde, 
Oxe0, Oxel, Oxe2, Oxe3, Oxe4, Oxe5, Oxe6, 
Oxe8, Oxe9, Oxea, Oxeb, Oxec, Oxed, Oxee, 
Oxf0, Oxfl, Oxf2, Oxf3, Oxf4, Oxf5, Oxf6, 
Oxf8, Oxf9, Oxfa, Oxfb, Oxfc, Oxfd, Oxfe, 


const short * Tolower - &tolow tab[1]: 


注意 terror 指令 的 使 用 ， 它 保证 了 只 有 在 假设 成 立 的 情况 下 代码 才 被 
正确 地 翻译 。<limits.h> 中 定义 的 宏 UCHAR MAX 给 出 了 unsigned char 类 型 
所 能 表示 的 最 大 值 。 
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Æ 2-17 
xtoupper.c 


/* _Toupper conversion table -- ASCII version */ 
#include «ctype.h» 
finclude «limits.h» 
finclude «stdio.h» 


#i£ EOF != -1 || UCHAR MAX !- 255 
#error WRONG TOUPPER TABLE 
fendif 


/* static data */ 
static const short toup tab[257] = (EOF, 
0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 
0x08, 0x09, Ox0a, Ox0b, Ox0c, O0x0d, Ox0e, OxOf, 
0x10, 0x11, 0x12, 0x13, 0x14, 0x15, 0x16, 0x17, 
0x18, 0x19, Oxia, Oxlb, Oxlc, Oxld, Oxle, Oxif, 
0x20, 0x21, 0x22, 0x23, 0x24, 0x25, 0x26, 0x27, 
0x28, 0x29, Ox2a, 0x2b, 0x2c, 0x2d, 0x2e, Ox2f, 
0x30, 0x31, 0x32, 0x33, 0x34, 0x35, 0x36, 0x37, 
0x38, 0x39, 0x3a, 0x3b, 0x3c, 0x3d, Ox3e, Ox3f, 


0x40, 'A', 'B', 'C', 'D', "EI, 'F', 'G', 
UMS, IN, dt, OPK, Lt, MN, 'N', (fO! 
'P', ‘Ql, PR, 'S', UN, CU', OVN, tw, 
UR, "Y, 'Z', 0x5b, Ox5c, 0x5d, Ox5e, Ox5f, 

0x60, 'A', 'B', 'C', 'D', 'E', 'F', 'G', 
'H', CIS, tt, 'K', Lt, 'M', 'N', '0', 
US, QT, 'Rt, 'S', CTS AC 
'X', "Y, 'Z', Ox7b, Ox7c, Did, Ox7e, Ox7f, 


0x80, 0x81, 0x82, 0x83, 0x84, 0x85, 0x86, 0x87, 
0x88, 0x89, Ox8a, Ox8b, Ox8c, 0x8d, O0x8e, Ox8f, 
0x90, 0x91, 0x92, 0x93, 0x94, 0x95, 0x96, 0x97, 
0x98, 0x99, Ox9a, Ox9b, 0x9c, O0x9d, O0x9%e, Ox9f, 
Oxa0, Oxal, Oxa2, Oxa3, Dad, Oxad, 0xa6, Oxa7, 
Oxa8, Oxa9, Oxaa, Oxab, Oxac, Oxad, Oxae, Oxaf, 
Oxb0, Oxbl, Oxb2, Oxb3, Oxb4, Oxb5, Oxb6, Oxb7, 
Oxb8, Oxb9, Oxba, Oxbb, Oxbc, Oxbd, Oxbe, Oxbf, 
Oxc0, Oxcl, Oxc2, Oxc3, Oxc4, Oxc5, Oxc6, Oxc7, 
Oxc8, Oxc9, Oxca, Oxcb, Oxcc, Oxcd, Oxce, Oxcf, 
Oxd0, Oxdl, Oxd2, Oxd3, Oxd4, 0xd5, 0xd6, Oxd7, 
Oxd8, 0x89, Oxda, Oxdb, Oxdc, Oxdd, Oxde, Oxdf, 
Oxe0, Oxel, 0xe2, Oxe3, O0xe4, 0xe5, 0xe6, Oxe7, 
0xe8, 0xe9, Oxea, Oxeb, Oxec, Oxed, Oxee, Oxef, 
Oxf0, Oxfl, Oxf2, Oxf3, Oxf4, Oxf5, Oxf6, Oxf7, 
Oxf8, Oxf9, Oxfa, Oxfb, Oxfc, Oxfd, Oxfe, Oxff): 


const short *_Toupper = &toup tab[1]; oO 


[mm 


数据 对 象 图 2-18 给 出 了 文件 xctype.c。 所 有 的 字符 分 类 函数 都 共用 一 个 Ctype 
Ctype ”指向 的 转换 表 ， 这 个 文件 就 定义 了 这 个 表 和 指针 。 
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图 2-18 /* .Ctype conversion table -- ASCII version */ 
xctype.c #include «ctype.h» 
#include «limits.h» 
#include <stdio.h> 
#if EOF != -1 || UCHAR_MAX != 255 
#error WRONG CTYPE TABLE 
fendif 


/* macros */ 
#define XDI ( DI| XD) 
#define XLO (| LO| XD) 
#define XUP ( UP| XD) 

/* static data */ 


Static const short ctyp tab[257] - (0, /* EOF */ 


( 
.BB, BB, BB, BB, BB, BB, BB, BB, 
BB CN CN CN, . CN CN BB, BB, 
_BB, BB, BB, BB, BB, BB, BB, BB, 
BB, BB, BB, BB, BB, BB, BB, BB, 
SP PU PU PU, PU PU PU, PU, 


"UP, UP, UP, PU, PU, PU, PU, — 
“pu, XLO, XLO, XLO, XLO, XLO, XLO, LO, 
o LO, LO, LO, LO, LO, _LO, L 


"T /* rest all match mothing */ 


const short * Ctype = &ctyp. tab[1]; 口 


2.5 «ctype.h» 的 测试 


只 有 <ctype. h> 声明 的 函数 接收 的 参数 值 都 有 效 时 ， 对 这 些 函 数 进行 测 
试 才 有 意义 。 最 好 既 能 测试 这 些 函数 又 能 测试 隐藏 这 些 函 数 的 宏 。 当 然 ， 那 
就 超出 了 只 测试 «ctype.h» 外 部 特性 的 范围 。 这 样 的 双重 测试 可 以 查找 头 文 
件 和 它 的 函数 内 部 工作 方式 的 漏洞 。 然 而 ， 这 是 一 个 函数 和 宏 都 很 重要 的 实 
例 。 我 们 希望 它们 都 能 够 按照 预想 的 方式 工作 。 


我 们 也 可 以 从 某 些 附加 的 信息 中 受益 一 一 比如 按照 编码 值 递增 的 顺序 ， 
显示 出 各 种 可 打印 类 别 的 字符 。 那 可 以 确保 所 有 我 们 想 看 到 的 字符 匹配 ， 而 
且 又 没有 多 余 的 东西 。 它 也 显示 了 “"C" 区 域 设 置 允许 的 所 有 附加 字符 ， 例 如 
附加 的 标点 符号 。 同 时 ， 它 也 让 我 们 看 到 了 一 个 类 别 中 各 个 字符 的 整理 顺序 。 


图 2-19 显示 了 测试 程序 tctype.c。 这 个 程序 显示 了 几 种 字符 分 类 ， 然 
后 测试 了 函数 和 它们 的 屏蔽 宏 。 注 意 在 第 二 个 测试 集合 中 函数 名 附近 使 用 了 
括号 。 这 跟 我 定义 库 中 的 每 个 可 视 函 数 所 用 的 技巧 相同 。 使 用 圆 括号 ， 那 些 
带 参 数 的 宏 就 不 会 掩盖 头 文件 前 面 的 部 分 真正 的 函数 的 声明 。 如 果 执 行 字符 
集 是 ASCII， 程 序 的 输出 是 : 


2-19 
tctype.c 


2.5 «ctype.h» 的 测试 


ispunct: !"&$$&'()*5, -./: ;<=>?@ [N]^ '([)- 
isdigit: 0123456789 

islower: abcdefghijklmnopqrstuvwxyz 

isupper: ABCDEFGHIJKLMNOPORSTUVWXYZ 


isalpha: ABCDEFGHIJKLMNOPORSTUVWXYZabcdefghijklmnopqrstuvwxyz 
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isalnum: 0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrs 


tuvwxyz 
SUCCESS testing <ctype.h> 


注意 到 ， 和 isalnum DC RPRUSEBRAYSEAEIEX EBT, HERR As Å 
页 面 还 没有 宽 到 可 以 把 它们 放 在 一 行 来 显示 。 这 行 字符 在 一 个 屏幕 足够 大 的 


FALL RS RTS 


/* test ctype functions and macros */ 
#include <assert.h> 

#include <ctype.h> 

#include <limits.h> 

#include <stdio.h> 


static void prclass(const char *name, int (*fn) (int)) 
{ /* display a printable character class 
int c; 


fputs (name, stdout); 
fputs(": ", stdout); 
for (c = EOP; c <= UCHAR MAX; ++C) 
if ((*fn)(c)) 
fputc(c, stdout); 
fputs("Mn",stdout); 
) 


main() 


*/ 


{ /* test both macros and functions */ 


char *s; 
int c; 


/* display printable classes */ 
prclass("ispunct", &ispunct); 
prclass("isdigit", &isdigit); 
prclass("islower", &islower); 
prclass("isupper", &isupper); 
prclass("isalpha", &isalpha); 
prclass("isalnum", &isalnum); 
/* test macros for required characters */ 
for (s = "0123456789"; *s; ++s) 
assert(isdigit(*s) && isxdigit(*s)); 
for (s = "abcdefABCDEF"; *s; ++S) 
assert (isxdigit (*s)); 
for (s = "abcdefghijklmnopgrstuvwxyz"; *s; ++s) 
assert (islower(*s))}; 
for (s = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"; *s; ++s) 
assert (isupper(*s)); 

for (s = "!\"#BE'() ;<=>?[NN] *4,-./:%_{|}~"; zer ++S) 
assert (ispunct (*s)); 

for (s = "\f\n\r\t\v"; *s; ++s) 

assert (isspace(*s) && iscntrl(*s)); 
assert (isspace('') && isprint('')); 
assert (iscntrl('\a') && iscntrl('Nb')); 

/* test macros for all valid codes */ 


图 2-19 for (c = EOF; c <= UCHAR MAX; ++C) 
(2E) { /* test for proper class membership */ 
if (isdigit(c)) 
assert(isalnum(c)); 
if (isupper(c)) 
assert (isalpha(c)); 
if (islower(c)) 
assert(isalpha(c)); 
if (isalpha(c)) 
assert(isalnum(c) && lisdigit(c)); 
if (isalnum(c)) 
assert(isgraph(c) && lispunct(c)); 
if (ispunct(c)) 
assert(isgraph(c)); 
if (isgraph(c)) 
assert(isprint(c)); 
if (isspace(c)) 
assert(c == '' || !isprint(c)): 
if (iscntrl(c)) 
assertí!isalnum(c)): 
) 
/* test functions for required characters */ 
for (s = "0123456789"; *s; ++s) 
assert((isdigit)(*s) && (isxdigit)(*s)); 
for (s = "abcdefABCDEF"; *s; ++S) 
assert ((isxdigit) (*s)); 
for (s = "abedefghijklmnoparstuvwxyz"; *s; ++s) 
assert ((islower) (*s)); 
for (s = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"; *s; ++8) 
assert ((isupper) (*s)); 
for (s = "!1\"#BE'() ;«222[NN] **,-./:^-(|)-"; *s; +48) 
assert ((ispunct) (*s)); 
for (s = "\f\n\r\t\v"; *s; ++s) 
assert ((isspace) (*s) && (iscntrl)(*s)); 
assert ((isspace) ('') && (isprint)('')); 
assert ((isentrl)('\a') && (iscntrl)('Mb')); 
/* test functions for all valid codes */ 
for (c = EOF; c <= UCHAR MAX; ++c) 
{ /* test for proper class membership */ 
if ((isdigit) (c)) 
assert ((isalnum) (c)); 
if ((isupper) (c)) 
assert ((isalpha) (c)); 
if ((islower) (c)) 
assert ((isalpha) (c)); 
if ((isalpha) (c)) 
assert ((isalnum) (ch && !(isdigit) (c)); 
if (isalnum(c)) 
assert ((isgraph)(c) && !(ispunct) (c)); 
if ((ispunct) (c)) 
assert ((isgraph) (c)); 
if ((isgraph) (c)) 
assert ((isprint) (c)); 
if ((isspace) (c)) 
assert(c == '' || !(isprint)(c)); 
if ((isentrl) (c)) 
assert (!(isalnum) (c)); 


} 


puts ("SUCCESS testing «ctype.h»"); 
return (0); 


} 
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27 习题 


2.1 


2.2 


2.3 


2.4 


2.5 


2.6 


2.7 


近年 来 ， 人 们 对 字符 集 的 关注 越 来 越 多 。 商 业 国 际 化 要 求 计算 机 可 以 支 
持 更 加 丰富 的 字符 集合 ， 而 不 是 传统 的 只 能 表示 英文 (和 C)。 很 多 计算 机 销 
售 商 开始 对 标准 的 8 位 字 节 所 能 表示 的 256 个 编码 进行 赋值 。 然 而 ， 那 些 保 
守 的 人 仍然 坚持 那个 可 以 用 7 位 编码 的 128 个 或 者 更 少 的 字符 的 集合 。 很 多 
实现 遵循 以 下 两 个 标准 : 
O ANSI Standard X3.4-1968 (New York: American National Standards 
Institute, 1989). 这 个 标准 定义 了 ASCII 字符 集合 ， 该 集合 使 用 7 位 编 
码 表示 字符 ， 在 现代 计算 机 中 被 广泛 使 用 。 
口 ISO Standard 646:1983 (Geneva: International Standards Organization, 
1983). 这 是 7 位 字符 编码 的 国际 标准 。 


列 出 对 下 面 字符 串 中 的 每 个 字符 返回 非 零 值 的 所 有 的 字符 分 类 函数 : 


"Hello, world!Nn" 


修改 <ctype.n> 中 声明 的 函数 ， 使 它 能 够 对 任意 的 参数 值 正 确 地 工作 。 对 一 
个 超出 范围 的 参数 值 可 以 采用 和 BOF 值 相同 的 处 理 方法 。 至 少 描述 两 种 报告 
参数 越界 的 错误 方法 。 


C 中 的 名 字 以 字母 开头 ， 后 面 可 以 跟 任意 多 个 字母 、 数 字 或 者 下 划 线 。 编 写 
函数 size t idlen(const char *s)， 该 函数 返回 的 是 以 s 开头 的 构成 标识 
符 的 字符 数量 。 如 果 没 有 以 s 开头 的 标志 符 ， 该 晴 数 返回 0。 


编写 函数 size t detab(char *dest, const char *src)， 该 郴 数 从 地 址 
src 复制 一 个 以 空 字符 结束 的 字符 串 到 aest， 并 将 源 字符 串 中 的 每 个 水 平 制 
表 符 替换 成 1 一 4 个 空格 。 假 设 制 表 符 4 列 一 个 ， 一 个 可 打印 字符 占 一 列 。 
其 他 的 影响 打印 位 置 的 字符 是 退 格 符 、 回 车 符 和 换行 符 。 返 回 aest 中 新 串 
的 长 度 。 

当 区 域 设置 改变 为 非 "c" 时 ， 你 在 习题 2.3 中 编写 的 函数 ialen 是 否 需 要 修 
改 才 能 正确 地 工作 ? 如 果 是 ， 给 出 修改 后 的 版 本 ， 如 果 不 是 ， 说 明理 由 。 


当 区 域 设 置 改变 为 非 "C" 时 ， 你 在 习题 2.4 PG IB B FÅ detab 是 否 需 要 修 
改 才能 正确 地 工作 ? 如 果 是 ， 给 出 修改 后 的 版 本 ， 如 果 不 是 ， 说 明理 由 。 

[ 难 ] 假设 你 希望 实现 一 个 可 以 共享 的 库 。 描 述 一 下 在 以 下 每 种 机 制 下 你 会 怎 
样 修改 本 章 的 代码 : 
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2.8 


2.9 


D 通过 命令 ， 翻 译 器 可 以 把 库 中 所 有 的 可 写 的 静态 存储 空间 复制 为 每 个 使 用 
该 共享 库 的 过 程 的 一 个 部 分 。 

D 可 以 向 <libstat.h> 声明 的 结构 Lib stat 中 添加 域 ， 也 可 以 为 文件 
libstat.c 中 该 结构 的 定义 添加 初始 值 。 

O 和 上 面相 同 ， 可 以 向 «libstat.n» 声明 的 结构 Lib stat 中 添加 域 ， 但 
只 能 通过 指向 该 结构 的 指针 _p 来 访问 它 ， 这 个 指针 也 由 «libstat.h» 声 
明 。 - 

O 可 以 向 <libstat.h> 声明 的 结构 Lib stat 中 添加 域 ， 而 且 只 能 通过 一 
个 指向 该 结构 的 指针 来 访问 它 ， 这 个 指针 由 函数 调用 _FP() 返回 ， 函 数 
_FP 也 由 <libstat.h> 声明 。 


a 一 个 或 者 多 个 控制 台 控 制 的 线程 ， 这 些 线程 使 
用 相同 的 静态 存储 空间 。 每 一 个 线程 独立 地 使 用 动态 存储 空间 (存储 类 别 
H auto (Aa) 或 者 register (寄存 器 ))。 你 要 实现 线程 的 原子 (atomic) 
库 一 一 在 这 个 库 中 ， 所 有 的 函数 都 不 会 因为 男 一 个 线程 改变 库 的 静态 存储 空 
间 的 状态 而 改变 它们 的 行为 ， 或 者 行为 出 错 。 你 可 以 通过 在 每 一 个 对 库 的 静 
态 存储 空间 的 访问 周围 加 上 一 些 同步 代码 (synchronization code)， 来 保证 它 
的 安全 。 就 像 下 面 的 代码 : 


lock(); 

p = _Ctype; 

_unlock(); 

说 明 怎 样 改动 本 章 的 代码 才能 使 它 安 全 地 应 用 于 多 线程 操作 。 那 对 性 能 有 什 
么 影响 ? 在 多 线程 操作 中 ， 你 怎样 才能 既 提 高 性 能 又 能 保证 代码 的 安全 性 ? 


[ 很 难 ] 修改 <ctype.h> 中 定义 的 宏 ， 使 它 对 任意 的 参数 值 都 能 正确 地 工作 。 
对 超出 范围 的 参数 值 可 以 采用 和 EOF 的 值 相同 的 处 理 方法 。 


<errno.h> 


历史 


如 果 必 须要 指出 C 标准 中 最 不 被 人 们 喜欢 的 一 部 分 ， 那 它 就 在 眼前 。 没 
有 人 喜欢 errno 或 者 它 所 指示 的 机 制 。 我 想 不 起 有 谁 支持 这 种 报告 错误 的 方 
法 ， 在 制定 C 标准 的 委员 会 X3J11 的 二 十 多 次 会 议 上 也 是 如 此 。 这 些 年 来 也 
有 人 提出 了 几 种 可 供 选 择 的 方案 ， 至 少 有 一 部 分 人 主张 抛弃 errno, TER 
今 仍 然 存 在 。 E 


C 标准 甚至 扩充 了 现 有 的 机 制 。 头 文件 <errno.h> 是 该 委员 会 的 发 明 。 
我 们 想 让 库 中 的 每 一 个 函数 和 数据 对 象 都 在 某 一 个 标准 头 文件 中 声明 。 我 们 
给 了 ermo 一 个 自己 的 头 文件 来 把 它 分 离 出 来 。 我 们 甚至 添加 了 一 些 说 明 ， 
希望 澄清 C 语言 中 不 明确 的 地 方 。 

一 个 在 致力 于 扩展 和 改进 C 的 群 组 中 一 直 讨 论 的 主题 是 怎样 驯服 er- 
rno， 或 者 怎样 摆脱 它 。 到 目前 为 止 还 没有 一 个 明确 的 答案 ， 这 也 许 会 告诉 你 
点 什么 东西 。 关 于 报告 和 处 理 错误 方面 ， 没 有 什么 简单 的 答案 。 


C 诞 生 于 UNIX 之 下 。 该 操作 系统 为 了 清晰 和 简单 而 定义 了 新 的 标准 。 
用 户 程序 和 操作 系统 内 核 之 间 的 接口 特别 清晰 。 你 可 以 指定 一 个 系统 调用 号 
和 几 个 操作 数 。 早 期 UNIX 的 40 多 个 系统 调用 在 那 几 十 年 中 在 数目 上 翻 了 
一 番 多 ， 但 是 和 其 他 具有 相当 功能 的 系统 相 比 ， 这 还 是 比较 少 的 。UNIX 系 
统 调用 的 操作 数 大 多 数 都 是 标量 一 一 整数 或 者 指针 。 它 们 同样 都 很 少 。 


UNIX 的 每 一 个 实现 对 错误 的 系统 调用 都 采用 一 种 简单 的 指示 方法 。 用 
汇编 语言 实现 ， 通 常 使 用 条 件 编码 的 进位 标志 来 测试 。 如 果 进 位 标志 被 清 零 ， 
系统 调用 就 成 功 了 。 要 求 的 所 有 结果 都 返回 到 机 器 寄存 器 或 者 程序 的 一 个 结 
构 中 。《〈 要 指定 该 结构 的 地 址 作为 系统 调用 的 一 个 参数 。) 如 果 进 位 标志 不 是 
零 ， 系 统 调用 就 出 错 了 。 一 个 机 器 寄存 器 记录 了 一 个 很 小 的 正 数 用 来 说 明 错 
误 的 性 质 。 
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C 中 的 
错误 处 理 


过 劳 的 机 制 


那 种 方法 对 汇编 来 说 非常 好 ， 但 对 于 用 C 编写 的 程序 来 说 就 不 是 那么 好 
了 。 可 以 编写 一 个 C 可 调用 的 函数 库 ， 其 中 每 个 函数 对 应 于 一 个 系统 调用 。 
当 执 行 一 个 特定 的 系统 调用 的 时 候 ， 我 们 希望 那个 对 应 的 函数 的 返回 值 为 我 
们 想 要 的 结果 。 这 样 做 虽然 可 以 ， 但 这 会 让 以 容易 测试 的 方式 报告 错误 变 得 
很 难 。 还 有 一 种 选择 ， 可 以 让 每 个 函数 返回 一 个 指示 成 功 或 者 失败 的 值 。 但 
那样 做 ， 又 很 难 从 一 个 成 功 的 系统 调用 中 得 到 你 想 要 的 结果 。 


一 个 通常 可 行 的 做 法 是 取 两 者 的 优点 。 对 一 个 一 般 的 系统 调用 来 说 ， 可 
以 定义 一 个 和 所 有 的 有 效 结果 都 不 相同 的 错误 返回 值 。 在 这 点 上 ， 空 指针 就 
是 一 个 例子 。 值 -1 也 可 以 在 很 多 情况 下 被 设 为 错误 返回 值 ， 而 不 会 和 有 效 
结果 冲突 。 每 个 UNIX 系统 调用 通常 有 一 个 这 样 的 返回 值 来 说 明 发 生 了 某 些 
形式 的 错误 。 l 

C 可 调用 的 函数 不 能 做 到 的 是 准确 地 报告 发 生 了 什么 错误 。 这 就 过 多 地 
限制 了 这 个 巧妙 的 方法 。 你 从 返回 值 能 得 到 的 所 有 信息 就 是 是 否 有 错误 发 生 。 
必须 从 其 他 的 地 方 来 获得 细节 。 


早期 的 UNIX 程序 员 采 用 的 “其 他 地 方 ” 是 一 个 具有 外 部 连接 的 数据 对 
象 。 任 何 失败 的 系统 调用 都 从 内 核 中 存储 一 个 叫做 errno 的 整 型 变量 作为 错 
误 编码 。 它 或 者 返回 -1， 或 者 返回 其 他 适当 的 无 意义 的 值 来 说 明 一 个 错误 。 
程序 在 大 多 数 情况 下 都 不 在 乎 细节 ， 错 误 就 是 错误 。 但 是 在 需要 了 解 细节 的 
少数 情况 下 ， 它 也 知道 怎样 得 到 这 些 额 外 的 信息 。 它 去 访问 errno 来 得 到 存 
储 在 那里 的 最 后 的 错误 编码 。 


所 以 ， 你 最 好 早点 访问 errno。 如 果 另 一 个 系统 调用 也 失败 了 ， 原 来 的 
错误 编码 就 会 被 新 的 错误 编码 覆盖 掉 。 你 也 只 能 在 一 个 系统 调用 失败 后 再 访 
问 errno 的 值 。 一 个 成 功 的 系统 调用 不 会 清空 存储 在 那 的 值 。 它 不 是 一 个 很 
好 的 机 制 ， 但 它 确实 很 实用 。 


ermo 的 第 一 个 问题 是 它 太 方便 了 。 人 们 便 开 始 寻找 它 的 更 多 用 途 。 
errno 从 一 个 为 了 增加 UNIX 系统 调用 数量 的 小 窍门 发 展 为 C 的 一 个 制度 。 
这 时 ， 它 就 开始 过 度 劳累 了 。 系 统 调 用 并 不 是 大 量 错误 发 生 的 唯一 地 方 。 帮 
一 个 公认 的 地 方 是 计算 一 般 数 学 函数 的 库 部 分 。( 见 第 7 章 .) 

一 些 函 数 接受 某 些 参数 后 产生 的 值 过 大 而 不 能 表示 (例如 
exp(1000.0)), 一 些 则 产生 的 值 过 小 而 不 能 表示 《例如 exp(-1000.0)); 一 
些 函数 对 某 些 参 数值 没有 定义 〈 例 如 sart (-1.0) )， 而 一 些 函 数 定 义 了 ， 但 
是 对 参数 值 没有 什么 价值 〈 例 如 sin(1e30)). 


可 以 为 每 一 个 可 能 引起 麻烦 的 函数 引入 一 个 或 者 多 个 错误 编码 。 根 据 
UNIX 错误 编码 的 命名 习惯 ， 对 一 个 负数 的 平方 根 可 以 报告 RSORT。 但 是 这 
样 就 没有 了 界限 而 且 容 易 引 起 混乱 。 


幸运 的 是 ， 数 学 错误 可 以 被 归结 为 以 下 几 类 : 
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D 当 一 个 结果 在 数值 上 上 太 大 而 不 能 作为 指定 类 型 的 浮 点 值 表示 的 时 候 就 
会 发 生 向 上 溢出 ; 
D 当 一 个 结果 在 数值 上 太 小 而 不 能 作为 指定 类 型 的 浮 点 值 表 示 的 时 候 就 
会 发 生 向 下 溢出 ; 
O 但 一 个 结果 没有 位 置 容纳 它 的 类 型 指示 的 有 效 位 的 时 候 就 会 发 生 有 效 
dE. : 
O 当 接受 一 个 指定 的 参数 值 而 产生 的 结果 没有 被 定义 的 时 候 就 会 发 生 域 
错误 。 
UNIX 下 一 些 不 同 的 系统 调用 会 产生 相同 的 错误 代码 。 相 似 地 ， 一 些 不 
同 的 数学 函数 也 会 产生 一 个 或 者 多 个 这 样 的 错误 在 使 用 浮 点 操作 数 的 时 候 ， 
这 些 错 误 甚至 会 在 所 有 的 数学 操作 符 中 产生 )。 实 际 上 ， 仅 使 用 两 个 错误 代 
码 就 足够 表示 所 有 的 数学 铺 误 : 


D 当 一 个 域 错误 发 生 时 报告 EDOM; 

O 当 溢 出 发 生 时 报告 ERANGE。 

有 效 值 丢 失 是 一 个 不 确定 是 否 要 报告 的 错误 。 一 个 程序 员 对 有 效 值 丢 失 
的 看 法 可 能 和 男 一 个 程序 员 完 全 不 同 。 确 实 ， 对 于 计算 过 程 这 一 部 分 而 言 ， 
一 个 稳定 的 算法 对 一 个 严格 的 有 效 值 丢失 并 不 是 很 敏感 。 因 此 ， 有 效 值 丢 失 
是 否 应 该 被 库 报告 是 一 个 有 争议 的 话题 。 

你 可 能 已 经 知道 下 面 要 说 什么 了 。 数 学 库 中 可 能 发 生 的 错误 和 系统 调 
用 的 一 样 多 。 我 们 需要 通过 某 种 方式 来 报告 数学 库 的 错误 。 所 以 当 手 中 已 
经 有 了 一 种 机 制 时 为 什么 要 重新 定义 一 个 呢 ? 通过 在 errno 中 存储 EDOM 和 
ERANGE 来 报告 数学 错误 是 C 标准 库 的 一 个 较 早 的 、 自 然 的 演化 。 这 种 做 法 
已 经 被 C 标准 认可 并 包含 在 内 。C 标准 也 清楚 地 说 明了 库 函 数 中 其 他 几 个 需 
要 设置 errno 的 地 方 。 完 整 的 清单 是 : 


O «math.h» 中 声明 的 很 多 函数 都 将 <errno.h> 中 声明 的 宏 EDOM 和 
ERANGE 的 值 存 储 在 errno 中 。 

D <stdlib.h> 中 声明 的 一 些 函 数 把 文本 串 转 换 为 各 类 算术 类 型 的 值 。 
这 些 函 数 的 部 分 或 者 全 部 将 ERANGE 存储 在 errno t, 

O <stdio.h> 中 声明 的 一 些 函 数 改变 文件 中 下 一 次 读 或 者 写 操作 的 位 
置 。 这 些 函 数 会 在 errno 中 存储 一 个 正 值 。 这 个 值 是 实现 定义 的 。 
本 书 的 实现 选择 EFPOS 作为 «exrno.n» 中 定义 的 宏 名 ， 该 宏和 那个 
值 相对 应 。 它 不 是 一 个 常用 的 名 字 。 

O «signal.h» 中 声明 的 函数 signal, MÆ ermo 中 存储 一 个 正 值 。 该 
值 甚 至 也 不 是 实现 定义 的 一 一 一 个 实现 可 以 按照 它 的 选择 去 做 ， 但 并 
不 显示 它 做 了 什么 。 因 为 signal 在 各 种 实现 中 差别 太 大 ， 所 以 在 这 
个 库 中 ， 我 没有 指定 特定 的 错误 编码 。 
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3.2 C 标准 的 内 容 


<errno.h> 


EDOM 
ERANGE 


errno 


7.1.4 错误 报告 <errno.h> 


KXIF <errno.h> 定义 了 几 个 宏 ， 这 些 宏 都 和 错误 状态 的 报告 有 关 。 
这 些 宏 是 : 

EDOM 

ERANGE 


它们 展开 为 具有 不 同 非 零 值 的 整数 常量 表达 式 ， 适 合 在 dit 预 处 理 指 令 中 使 用 。 而 宏 
errno 
则 展开 为 一 个 可 以 修改 的 int 类 型 的 左 值 ”， 它 的 值 被 某 几 个 库 函 数 设 置 为 一 个 正 的 错误 
编号 。 无 需 说 明 errno 是 一 个 宏 还 是 一 个 声明 为 具有 外 部 连接 的 标识 符 。 如 果 为 了 访问 一 
个 实际 的 对 象 掩盖 了 一 个 宏 定义 ， 或 者 一 个 程序 定义 了 一 个 名 字 为 errno 的 标识 符 ， 那 么 
这 种 行为 是 未 定义 的 。 
errno 的 值 在 程序 启动 时 为 零 ， 但 是 它 决 不 会 被 任何 库 函 数 设 为 零 ”。 如 果 errno 的 
使 用 没有 记录 在 这 个 国际 标准 中 的 函数 说 明 中 ， 那 么 不 管 是 否 存在 错误 ，errno 的 值 都 可 
能 被 设置 为 非 零 。 
以 和 一 个 数字 或 者 E 和 一 个 大 写字 母 开 头 的 附加 宏 的 定义 ， 也 可 能 由 实现 来 详细 说 明 。 
脚注 
92. 宏 errno 不 一 定 是 一 个 对 象 的 标识 符 ， 它 也 可 能 展开 为 一 个 函数 调用 返回 的 ， 可 
以 修改 的 lvalue (例如 *errno () )。 
93. 因此 ， 一 个 程序 如 果 使 用 errno 进行 错误 检查 ， 应 该 在 一 个 库 函 数 调用 之 前 把 它 
设 为 零 ， 然 后 ， 在 下 一 个 库 函 数 调用 之 前 查看 它 。 当 然 ， 一 个 库 函 数 可 以 先 保存 
ermo 的 值 ， 然 后 再 把 它 设 为 零 ， 在 函数 返回 之 前 ， 如 果 ermo 的 值 仍 为 零 ， 只 
要 让 它 恢复 为 原始 值 就 可 以 了 。 
94. 参考 “ 库 的 展望 ”(7.13.1)。 


3.3 «errno.h» 的 使 用 


C 标准 关于 可 以 报告 的 错误 说 得 并 不 是 很 详细 ， 它 甚至 对 所 有 错误 编码 
的 值 或 者 用 来 确定 那些 值 的 宏 名 说 得 更 少 。 那 是 因为 在 各 种 实现 中 它们 的 用 
法 有 很 大 的 不 同 。 甚 至 不 同 的 UNIX 版 本 都 定义 不 同 的 错误 编码 集合 。 


如 果 你 为 一 个 特定 的 系统 写 代 码 ， 你 可 能 不 得 不 学 习 它 特定 的 错误 编码 
集合 。 如 果 可 能 的 话 ， 列 出 头 文件 <errno.h>。 所 有 的 错误 编码 都 应 该 作为 
以 己 开 头 的 宏 在 那里 被 定义 。 阅 读 所 有 你 可 以 找到 的 关于 错误 编码 细节 的 文 
档 ， 然 后 准备 做 些 试验 。 在 这 个 领域 ， 文 档 一 向 不 是 那么 完整 和 准确 。 


如 果 想 编写 可 移植 的 代码 ， 一 定 要 避免 任何 附加 的 错误 编码 的 假设 。 只 
能 依靠 C 标准 中 指定 的 errno 属性 ，3.1 节 中 有 完整 列表 。 然 而 ， 几 乎 不 
需要 很 清楚 地 知道 错误 编码 。C 标准 的 脚注 93 (上面 已 给 出 ) 讲述 了 使 用 
errno 最 安全 的 编码 方式 。 在 一 个 库 函 数 调用 之 前 把 它 设 为 0， 然后 在 下 一 
个 库 调 用 前 测试 它 的 任何 非 零 值 : 
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#include <errno.h> 
#include <math,h> 


errno = 0; 
y = sqrt(x); 
if (errno != 0) 


printf("invalid x: %e\n",x); 
不 论 一 个 库 函 数 是 多 人 么 简单 ， 决 不 要 认为 它 不 会 对 ermo 造成 任何 影 
响 。 这 是 一 个 相当 令 人 头疼 的 方法 。 
3.4 <errno.h> 的 实现 


从 表面 来 看 ，C 标准 在 这 个 领域 对 实现 的 要 求 很 少 ， 可 以 简单 地 把 文件 
errno.h BY: 


/* errno.h standard header */ 
#ifndef | ERRNO 
fidefine ERRNO 


#define EDOM 1 
#define ERANGE 2 


extern int errno; 


#endi f 


在 某 个 库 文件 中 ， 必 须 为 数据 对 象 添 加 一 个 定义 : 


int errno = 0; 


唯一 必须 做 的 另外 一 件 事 是 在 库 琐 数 内 适当 的 位 置 把 像 EDOM 和 ERANGE 
这 样 的 值 存储 在 ermo 中 。 还 有 比 这 更 简单 的 吗 ? 


这 里 有 一 个 例子 ， 在 这 个 例子 中 这 种 实现 显然 是 全 部 工作 中 最 简单 的 部 
分 。errno 会 在 两 个 微妙 的 方向 制造 麻烦 一 一 有 时 它 的 说 明太 模糊 ， 有 时 它 
的 说 明 又 太 清 楚 了 。 下 面 就 是 这 方面 的 解释 。 

太 多 和 太 少 模糊 性 源 于 过 去 对 errno 的 最 初 记录 系统 调用 错误 的 用 法 。 这 种 用 法 已 
经 被 C 标准 时 认 了 。 所 有 库 函 数 都 可 以 在 ermo 中 存储 非 零 值 。 这 些 存 储 可 
以 实现 是 因为 函数 可 以 执行 一 个 或 者 多 个 失败 的 系统 调用 , 或 者 因为 某 个 库 
函数 选择 使 用 这 种 报告 〈 错 误 ) 的 方法 。 

所 有 能 依赖 的 只 有 C 标准 中 明确 规定 的 那 部 分 行为 。 调 用 sat (-1.0) 
就 可 以 确定 地 知道 errno 包含 EDOM 的 值 。 不 管 你 是 否 相 信 ， 调 用 fabs (x) 
对 errno 都 没有 任何 影响 。 没 有 一 个 库 消 数 会 把 0 存储 到 errno 中 。 而 其 他 
任何 值 则 都 有 可 能 。 

规定 太 多 主要 影响 了 数学 函数 。 通 过 清楚 地 说 明 errno 必须 设 定 的 场 
合 ，C 标准 干预 了 重要 的 优化 部 分 。 特 别 地 ，C 标准 使 编译 器 很 难 利用 最 新 
的 浮 点 运算 协 处 理 器 的 优势 。 
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f& Intel 80X87 系列 和 Motorola MC68881 这 样 的 芯片 有 很 多 相当 复杂 的 
指令 。 一 些 指令 可 以 用 内 联 代码 计算 一 个 数学 函数 的 部 分 或 者 全 部 。 一 个 好 
的 编译 器 可 以 通过 使 用 这 些 指 令 极 大 地 提高 计算 速度 。 如 果 没 有 其 他 的 东西 ， 
一 个 编译 器 可 以 为 一 个 数学 函数 避免 函数 调用 和 返回 的 开销 。 


当 一 个 数学 异常 发 生 时 ， 问 题 就 出 现 了 。 这 些 数 学 协 处 理 器 独立 地 工 
作 ， 而 且 想 不 停 地 运转 。 它 们 希望 通过 传送 一 个 特别 的 、 叫 做 NaN (“Not a 
Number” 的 缩写 ) 或 者 Inf (“infinity” 的 缩写 ) 的 编码 来 记录 一 个 错误 。 后 
面 的 操作 保留 这 些 特别 的 代码 。 我 们 可 以 在 计算 的 最 后 来 检查 整个 过 程 中 是 
否 有 错误 发 生 。 

最 好 的 选择 是 ， 这 些 协 处 理 器 用 它们 自己 的 状态 码 记 录 错 误 的 发 生 。 主 
处 理 器 必须 把 协 处 理 器 的 状态 码 复 制 过 来 才能 检查 是 否 有 错误 发 生 。 这 就 阻 
止 了 流水 线 协 处 理 器 的 全 速 运转 。 如 果 一 个 C 程序 必须 在 每 一 个 数学 异常 中 
设置 errno， 它 就 不 能 让 协 处 理 器 以 最 高 的 速度 来 运行 。 


C 标准 的 脚注 92 提出 了 一 种 解决 方法 。C 标准 并 没有 要 求 errno 是 一 个 ` 
真实 的 数据 对 象 。 它 作为 一 个 宏 来 定义 ， 这 个 宏 可 以 被 扩展 为 一 个 可 更 改 的 
左 值 一 一 一 个 可 以 在 赋值 操作 符 《〈 例 如 =") 左边 指定 一 个 数据 对 象 的 任意 
的 表达 式 。 这 就 给 了 实现 者 相当 大 的 空间 。 特 别 地 ， 宏 errno 可 以 扩展 为 像 
*_Erfun() 这 样 的 表达 式 。 每 当 程序 想 检 查 错误 的 时 候 ， 它 就 会 调用 一 个 函 
数 来 告诉 程序 去 哪个 地 方 找 。 


这 样 做 有 两 个 含义 。 首 先 ， 实 现 可 能 不 想 记 录 错 误 ， 它 可 以 等 到 有 人 急 
切 地 寻找 errno 的 时 候 才 记录 最 新 的 错误 编码 。 这 就 可 能 给 实现 足够 的 自由 
来 让 数学 协 处 理 器 在 大 部 分 时 间 独 立地 工作 然而， 翻译 器 可 能 被 强迫 使 用 
这 种 方法 )。 

第 二 个 含义 是 errno 可 以 到 处 移动 。 函 数 在 每 次 被 调用 时 都 可 以 返回 一 
个 不 同 的 地 址 。 这 对 实现 共享 库 是 一 个 很 大 的 帮助 。 就 像 2.4 节 所 说 的 ， 静 
态 存储 空间 对 共享 库 来 说 是 一 个 麻烦 的 东西 。 用 户 程序 可 以 任意 改变 的 静态 
存储 空间 的 情况 更 糟 。errno 是 C 标准 库 在 这 方面 唯一 的 创造 。 


即使 作为 一 个 宏 ，errno 仍然 是 体制 中 令 人 讨厌 的 一 部 分 。 任 何 程序 都 
可 以 包含 下 面 的 代码 : 


y = sqrt(x); 
if (errno -- EDOM) 


支持 这 种 错误 检测 的 需求 严重 地 限制 了 实现 对 sart 之 类 的 函数 的 操作 。 
因为 任何 库 函 数 都 可 以 修改 srrno， 所 以 程序 员 也 不 能 得 到 很 好 的 服务 。 这 
里 我 们 得 到 的 是 一 个 让 实现 者 和 用 户 都 很 为 难 的 机 制 。 
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参数 编码 


图 3-1 


errno.h 


图 3-1 给 出 了 errno.h 的 代码 。 它 不 像 我 在 前 面 说 明 的 代码 那么 简单 。 
那 是 因为 我 想 使 它 参 数 化 。 这 种 简单 的 形式 一 定 要 作 些 修改 以 适合 每 个 管理 
库 的 操作 系统 。 其 他 的 库 函 数 或 者 操作 系统 本 身 可 能 对 错误 编码 的 值 有 预定 
的 概念 。 我 们 必须 修改 这 个 头 文件 来 匹配 或 者 容忍 这 种 令 人 惊讶 的 无 规则 性 。 


/* errno.h standard header */ 
#ifndef _ERRNO 
#define _ERRNO 
#ifndef _YVALS 
#include <yvals.h> 
#endif 

/* error codes */ 
#define EDOM _EDOM 
#define ERANGE | ERANGE 
#define EFPOS _EFPOS 

/* ADD YOURS HERE */ 

#define NERR _ERRMAX /* one more than last code */ 

/* declarations */ 
extern int errno; 
#endif 


使 用 «exrno.h» 的 大 部 分 代码 都 很 在 意 一 两 个 错误 编码 的 值 。 就 像 3.2 
节 中 提 到 的 那样 ， 这 些 值 随 操作 系统 的 改变 而 改变 。 一 两 个 库 函 数 需 要 知道 
错误 编码 的 有 效 范围 。 这 个 取 值 范围 也 因 操 作 系 统 而 异 。 


在 第 一 次 实现 这 个 库 之 后 ， 我 开始 把 它 移植 到 各 种 环境 下 。 我 发 现 十 几 
个 文件 必须 在 很 小 的 地 方 修改 。 很 快 ， 我 就 被 维护 这 十 几 个 文件 的 各 个 版 本 
打败 了 。 


这 就 促使 我 引入 一 个 叫做 “内 部 标准 头 文件 ”的 东西 。 一 些 标准 头 文件 
包含 头 文件 «yvals.h» 〈 尖 括号 告诉 编译 器 在 其 他 标准 头 文件 存储 的 地 方 找 
这 个 头 文件 ， 这 可 能 会 在 某 些 系 统 上 产生 问题 )。 我 把 为 实现 库 的 可 移植 性 
必须 修改 的 东西 集中 到 这 个 文件 中 。 


头 文件 <errno.h> 以 «yvals.h» 中 定义 的 其 他 宏 为 基础 定义 了 自己 的 
宏 。 这 种 分 两 步 的 过 程 是 必要 的 ， 因 为 其 他 的 头 文件 也 包含 <yvals.h>。 只 
有 当 程 序 包含 了 <errno.h> 时 ， 才 能 定义 宏 ERANGE。 


同时 也 要 注意 <yvals.h> 的 宏 保 护 是 在 包含 <yvals.h> 的 头 文件 中 ， 而 
不 是 在 <yvals.h> 中 。 这 是 一 个 小 的 优化 。 因 为 几 个 标准 头 文件 包含 这 个 头 
文件 时 ， 它 很 可 能 在 一 个 翻译 单元 中 被 多 次 请 求 。 一 旦 <yvals.h> 变 为 翻译 
单元 的 一 部 分 ， 宏 保护 就 会 跳 过 #include 预 处 理 指令 。 这 个 头 文件 也 就 不 
会 被 重复 地 读 入 。 


图 3-2 


errno.c 


. EDOM 

. ERANGE 
. EFPOS 
. ERRMAX 


头 文件 


"yfuns.h" 


图 3-3 


terrno.c 


<errno.h> 


/* errno storage */ 
Hinclude <errno.h> 
#undef errno 


int errno = 0; 


头 文件 <yvals.h> 是 各 种 值 的 大 杂烩 。 附 录 A 给 出 了 各 种 常见 的 操作 
系统 的 头 文件 版 本 。 这 里 只 列 出 了 <yvals.h> 中 影响 <errno.h> 的 宏 。 这 些 
值 和 装载 在 Sun 工作 站 的 UNIX 系统 下 Borland Turbo C++ 的 编译 器 和 DEC 
VAX 下 的 ULTRIX 的 编译 器 相 一 致 : 

#define |EDOM 33 

#define FRANGE 34 

#define EFPOS 35 

#define _ERRMAX 36 


然而 ， 请 注意 ， 这 些 值 并 不 适用 于 所 有 的 情况 。 


我 要 强调 的 是 ， 使 这 个 库 适 用 于 一 个 给 定 的 操作 系统 ， 仅 仅 有 <vvals.h> 
是 不 够 的 。 在 这 本 书 的 后 面 ， 我 会 引入 另 一 个 叫做 "yfuns.h" 的 头 文件 ( 见 
124 节 )。 该 头 文 件 的 作用 与 其 相似 但 并 不 相同 。 甚 至 两 个 头 文件 也 是 不 够 
的 。C 标准 库 中 的 很 多 函数 在 不 同 的 操作 系统 中 参数 化 的 差别 太 大 ， 因 此 ， 
它们 也 出 现 了 不 同 的 版 本 。 你 会 在 后 面 的 章节 中 不 时 地 看 到 它们 。 


图 3-2 显示 了 定义 errno 数据 对 象 的 文件 error.c. fundef 预 处 理 指 令 
只 是 将 来 <errno.h> 改变 的 一 个 安全 保证 。 


/* test errno macro */ 
finclude <assert.h> 
#include <errno.h> 
#include «math.h» 
#include <stdio.h> 


int main() 


{ /* test basic workings of errno */ 
assert(errno == 0); 

perror("No error reported as"); 
errno = ERANGE; 


assert(errno == ERANGE) ; 
perror("Range error reported as"); 
errno = 0; 

assert(errno == 0); 

sqrt{-1.0); 

assert (errno == EDOM) ; 


perror("Domain error reported as"); 
puts ("SUCCESS testing <errno.h>"); 
return(0); 


} 


邮 


3.5 «errno.h» 的 测试 


图 3-3 显示 了 测试 程序 terrno .c。 它 做 的 工作 不 和 多。C 标准 对 <ermo.h> . 


的 属性 描述 得 很 少 。terrno.c 主要 用 来 保证 一 个 程序 可 以 把 值 存储 到 errno 
中 并 且 能 找 回 这 些 值 。 


为 了 便于 查看 ， 测 试 程序 也 显示 了 标准 错误 编码 是 如 何在 输出 时 出 现 
的 。<stdio.h> 中 声明 的 函数 perror 写 人 一 行文 本 到 标准 错误 流 。 这 个 子 
数 根 据 errno 的 内 容 确定 文本 行 的 最 后 一 部 分 。 如 果 一 切 顺利 ， 运 行 ter- 
rno.c 的 可 执行 程序 会 显示 以 下 输出 : 


No error reported as: no error 

Range error reported as: range error 
Domain error reported as: domain error 
SUCCESS testing <errno.h> 


我 必须 再 次 提醒 : 这 个 输出 既 来 自 标准 错误 流 又 来 自 标准 输出 流 。 虽 然 
此 处 这 种 情况 的 可 能 性 很 小 ， 但 某 些 实 现 可 能 会 重新 排列 这 些 文本 行 。 
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David Stevenson, “A Proposed Standard for Binary Floating-Point Arithmetic,” 
Computer, 14:3 (1981), pp. 51-62. Computer 杂志 的 这 篇 文章 和 同一 期 后 面 的 一 
些 文章 解释 了 IEEE 754 浮 点 数 标准 的 很 多 方面 。 
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Prentice Hall, Inc., 1985). Rochkind 描述 了 errno 和 它 的 错误 编码 起 源 的 地 
方 一 一 UNIX 系统 调用 。 


列 出 你 使 用 的 C 翻译 器 定义 的 错误 编码 。 你 能 用 一 句 话 描述 每 个 错误 编码 说 
明了 什么 错误 吗 ? 

对 你 使 用 的 C 翻译 器 定义 的 错误 编码 ， 为 每 一 个 编码 设计 一 个 可 以 使 它 发 生 
的 测试 实例 。 

在 什么 情况 下 你 希望 准确 地 知道 哪 一 个 错误 编码 是 最 后 报告 的 ? 

修改 测试 程序 terrno.c， 使 对 所 有 有 效 的 错误 编码 调用 perror。<errno.h> 
中 定义 的 宏 _NERR 的 值 比 最 大 的 有 效 错误 编码 值 大 1 。 

假设 有 一 个 函数 int_Getfcc(void)， 它 返回 0、EDOM 或 者 FRANGE。 这 些 
值 可 以 反映 函数 的 上 一 次 调用 之 后 的 最 后 一 个 浮 点 错误 (如 果 有 的 话 )。 写 
出 一 个 版 本 的 <erzrno.h>， 该 版 本 能 使 用 这 个 珊 数 来 搜集 程序 在 使 用 存储 在 
errno 中 的 值 的 时 候 出 现 的 浮 点 错误 。 


<errno.h> 


3.7 


[3E] 编写 «errno.h» 的 一 个 版 本 ， 该 版 本 可 以 将 存储 在 errno 中 的 值 排队 ， 
而 且 当 程序 使 用 这 些 值 时 ， 可 以 把 这 些 值 按 顺 序 返 回 。 什 么 时 候 把 一 个 值 从 
队列 中 移 除 是 安全 的 ? 


[ 很 难 ] 消除 C 标准 库 中 使 用 errno 的 必要 ; 考虑 一 下 每 个 可 能 在 errno 中 
存储 值 的 函数 。 保 证 每 个 函数 都 有 一 种 方式 来 指定 几 个 不 同 的 错误 返回 值 。 
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<float.h> 


浮 点 算术 非常 复杂 ， 很 多 小 的 处 理 器 在 硬件 指令 方面 甚至 不 支持 浮 点 算 
术 ， 其 他 的 则 需要 一 个 独立 的 协 处 理 器 来 处 理 这 种 运算 ， 只 有 最 复杂 的 计算 
机 才 会 在 标准 硬件 指令 集中 支持 浮 点 运算 。 


出 于 实际 的 考虑 ， 芯 片 设计 人 员 经 常 省 略 了 浮 点 算术 ， 因 为 实现 浮 点 比 
较 、 加 法 、 减 法 、 乘 法 和 除法 花费 的 微 码 的 数量 和 实现 其 他 所 有 指令 的 相同 。 
通过 舍弃 浮 点 支持 ， 本 质 上 可 以 把 微 处 理 器 的 复杂 度 减 半 。 


很 多 应 用 程序 根本 不 需要 浮 点 算术 ， 其 他 的 可 以 通过 软件 来 实现 浮 点 运 
算 ， 只 不 过 需要 适度 容忍 不 良 的 性 能 ， 和 有 几 千 字 节 的 额外 代码 。 只 有 很 少 的 
应 用 程序 需要 高 性 能 算术 运算 ,但 它们 对 硬件 的 要 求 也 很 昂贵 。 所 以 ， 一 -个 
协 处 理 器 的 额外 花费 是 可 以 接受 的 。 


早期 的 C 工作 在 PDP-11/45 计算 机 下 ， 那 就 严重 影响 了 C 处 理 浮 点 算术 
HIT. UN, float 类 型 (32 位 格式 ) 和 double 类 型 (64 位 格式 ) 在 C 刚 
出 现 的 时 候 就 存在 了 ， 它 们 正 是 PDP-11 支持 的 两 种 格式 。 但 对 于 这 样 一 个 
比较 小 的 系统 实现 语言 来 说 ， 那 就 有 点 不 寻常 了 。 


PDP-11/45 FPP 可 以 在 两 种 模式 下 工作 ， 它 可 以 对 32 位 或 者 64 位 操作 
数 做 所 有 的 算术 运算 ， 但 必须 通过 一 条 指令 在 两 种 模式 间 转 换 。 另 一 方面 ， 
载 人 并 转换 一 个 错误 位 数 的 操作 数 ， 就 像 载 人 一 个 正确 位 数 的 操作 数 那样 简 
单 。 这 就 强烈 地 鼓励 FPP 只 保留 一 种 模式 。 这 样 ， 我 们 就 能 解释 为 什么 多 年 
来 C 语言 对 任何 涉及 浮 点 操作 数 的 操作 符 都 产生 double 类 型 的 结果 ， 即 使 两 
个 操作 数 都 是 float 类 型 。 就 算 FORTRAN 也 没有 这 人 么 慷慨 。 


当 C 移植 到 其 他 的 计算 机 体系 下 时 ， 这 些 优点 有 时 候 变 成 了 一 个 麻烦 。 
那些 希望 支持 全 部 语言 的 编译 器 作者 不 得 不 为 一 些 非常 小 的 机 器 编写 浮 点 运 
算 软 件 ， 实 际 上 这 并 不 简单 。 在 那些 作为 标准 硬件 支持 浮 点 运算 的 机 器 上 也 
出 现 了 一 系列 的 问题 ， 可 能 是 因为 它们 的 格式 有 轻微 的 不 同 。 这 就 使 编写 可 
移植 代码 更 加 困难 ， 你 需要 编写 数学 函数 和 转换 算法 来 使 它们 的 值 在 一 定 的 
范围 和 精度 内 变化 。 
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那些 提供 浮 点 运算 作为 选项 的 机 器 无 疑 是 最 坏 的 情况 ， 至 少 对 编译 器 的 
实现 者 来 说 是 这 样 的 。 首 先 ， 那 些 实现 者 一 定 要 为 那些 没有 这 些 选 项 的 机 器 
提供 软件 支持 。 当 机 器 有 这 个 选项 的 时 候 他 们 还 必须 利用 那些 机 器 指令 。 同 
时 有 些 糊涂 的 用 户 无 意 间 链接 了 两 种 代码 风格 或 者 库 中 的 错误 版 本 ， 因 此 编 
译 器 作者 还 要 处 理 这 些 用 户 的 问题 。 而 且 在 那些 保存 中 间 结 果 的 地 方 ， 浮 点 
支持 的 硬件 和 软件 版 本 很 少 情况 下 会 一 致 。 


然而 ， 从 语言 的 立场 来 说 ， 这 些 问 题 中 的 大 部 分 都 是 毫 无 联系 的 ， 因 此 
C 标准 的 起 草 者 必须 处 理 的 主要 问题 变化 太 多 了 。 充 分 发 挥 机 器 的 性 能 是 C 
的 优良 传统 。 即 使 一 个 右 移 操作 符 也 要 按照 底层 机 器 最 快 的 方式 执行 ， 更 不 
用 说 一 个 浮 点 加 法 运算 符 了 。 当 然 ， 这 两 种 结果 都 达 不 到 数学 家 的 要 求 。 

对 浮 点 算术 来 说 ， 上 溢 和 下 溢 是 两 个 突出 的 问题 。 一 个 结果 可 能 太 大 了 
而 不 能 在 一 台 机 需 上 表示 ， 但 对 另 一 台 机 器 却 不 是 这 样 。 结 果 上 滋 可 能 会 导 
致 中 断 ， 也 可 能 会 生成 一 个 特殊 的 编码 值 ， 或 者 会 产生 一 个 很 容易 被 误 认 为 
一 个 有 效 值 的 垃圾 值 。 一 个 结果 也 可 能 太 小 了 而 不 能 在 一 台 机 器 上 表示 ， 但 
在 另 一 台 机 器 上 却 可 以 表示 。 结 果 下 溢 可 能 会 导致 中 断 ， 也 可 能 偷偷 地 被 一 
个 精确 的 零 代 替 ， 这 样 的 0 修正 (zero fixup) 通常 是 一 个 不 错 的 选择 ， 但 不 
总 是 这 样 。 新 手 总 是 会 写 出 容易 受 洲 出 影响 的 代码 。 浮 点 数 所 能 表示 的 大 范 
围 值 引发 无 知 的 编程 者 不 注意 溢出 这 一 点 。 其 实 ， 我 们 首先 应 该 做 的 就 是 估 
HÆRER, RENA 
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的 数值 ， 但 这 是 有 代价 的 。 一 个 值 只 能 表示 为 固定 的 精度 。 把 两 个 精确 的 数 
相 乘 后 你 可 能 只 能 得 到 一 半 的 有 效 值 。 把 两 个 大 小 相近 的 数 相 减 ， 可 能 会 丢 
失 大 部 分 或 者 全 部 的 有 效 值 。 


普通 程序 员 经 常会 遇 到 意 想 不 到 的 有 效 值 丢 失 。 有 些 课本 上 看 起 来 非常 
好 的 公式 转换 为 代码 的 时 候 却 漏洞 百出 。 你 很 难 发 现在 一 个 序列 的 临近 单元 
之 间 变 换 符号 的 危险 ， 直 到 你 被 它们 所 困扰 。 那 就 是 说 ， 你 要 学 会 执行 形式 
上 而 不 是 实际 运行 的 减法 。 


上 潜 、 下 溢 和 有 效 值 丢 失 对 浮 点 算术 来 说 是 固有 的 。 它 们 在 一 个 给 定 的 
计算 机 体系 下 就 很 难 对 付 了 ， 编 写 出 具有 可 移植 性 的 代码 更 难 。 起 草 一 个 说 
明 怎样 写 出 可 移植 代码 的 标准 比 它 还 要 难 。 但 是 ， 还 有 一 个 更 糟糕 的 问题 。 


两 台 机 器 可 以 使 用 相同 的 浮 点 值 表示 方法 。 然 而 ， 在 每 台 机 器 下 把 两 个 
相同 的 值 相 加， 可 能 会 得 到 不 同 的 结果 。 那 些 结果 在 一 定 程 度 上 依赖 于 那 两 
台 机 器 的 伟人 方式 。 它 们 可 以 把 那些 不 能 表示 的 值 直接 截 去 并 舍 人 到 和 它 最 
接近 的 可 表示 的 值 ， 或 者 执行 一 些 其 他 相似 的 但 还 有 些微 小 差别 的 操作 。 
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或 者 你 仅仅 可 以 得 到 一 个 错误 的 结果 。 在 某 些 场合 下 ， 得 到 一 个 快速 的 
管 案 比 得 到 一 个 尽 可 能 精确 的 答案 要 好 得 多 。Seymour Cray 已 经 成 功 地 建立 
了 几 个 计算 机 公司 来 满足 有 这 种 需求 的 客户 ， 这 些 机 器 在 某 些 地 方 对 精度 的 
处 理 几乎 就 是 保留 最 低 有 效 位 。 有 了 时 它 固定 一 位 或 者 两 位 ， 即 使 它们 有 更 多 
的 有 效 位 。 甚 至 有 些 计 算 机 (不 是 Cray 设计 的 ) 在 每 次 乘 以 1 的 时 候 都 至 少 
去 掉 4 位 最 低 有 效 位 。 

AUR C 标准 宣布 这 种 行为 是 非法 的 ， 它 就 永远 不 会 被 认可 。 但 有 太 多 的 
机 器 使 用 这 种 快餐 式 〈quick-and-dirty) 的 浮 点 算术 计算 方法 ， 太 多 的 人 仍然 
使 用 这 些 机 器 。 否 定 了 它们 ， 与 C 标准 一 致 的 C 编译 器 在 商业 上 将 是 不 可 接 
受 的 。 

浮 点 型 的 描述 于 是 ， 浮 点 算术 领域 的 C 标准 通常 都 是 描述 性 的 。 它 尽量 定义 足够 多 的 
术语 来 讨论 浮 点 型 的 参 变 量 ， 但 是 对 怎样 才 算 是 得 到 了 一 个 正确 的 结果 ， 它 
几乎 没有 说 明 。 

X3J11 委员 会 加 入 了 头 文件 <float.h> 来 补充 已 经 存在 的 头 文件 
<limits.h>。 我 们 把 那些 可 能 对 严格 的 数值 运算 程序 员 有 用 的 每 一 个 参数 都 
加 入 到 «£loat.h» 中 。 从 这 些 宏 中 ， 你 就 可 以 充分 地 了 解 运行 环 境 的 属性 。 
这 样 ， 你 就 可 以 更 好 地 编写 数值 算法 。( 和 我 前 面 的 立场 不 同 ， 帮 助 这 类 程 
序 员 的 主要 动力 来 自 Cray Research. ) 
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库 部 分 对 <float.h> 的 说 明 非 常 少 。 
7.1.5 范围 «£1oat.h» 和 «limits.h» 

头 文件 «£10at.h» 和 «limits.h» 定义 了 几 个 可 以 展开 为 各 种 范围 和 参数 的 宏 。 

这 些 宏 ， 及 它们 的 意思 和 对 它们 的 值 的 限定 (或 者 约束 〉 都 在 52.42 中 列 出 来 了 。 

对 «£10at.h» 的 详细 说 明 在 环境 部 分 。 
5.2.4.2.2 浮 点 类 型 的 特征 <f loat.h> 


<float .h> 浮 点 类 型 的 特征 是 在 一 个 模型 的 基础 上 定义 的 ， 这 个 模型 描述 了 浮 点 数字 和 一 些 值 的 
表示 方法 ， 这 些 值 提供 了 一 个 实现 的 浮 点 算术 的 信息 "。 下 面 的 参数 被 用 来 定义 每 一 个 浮 
点 类 型 的 模型 。 
s 符号 ( 土 1) 


b 指数 表示 的 基数 《一 个 大 于 1 的 整数 ) 

e 指数 (一 个 值 在 eu。 和 mar 之 间 的 整数 ) 

p 精度 Cb 进 制 数 的 有 效 位 数 ) 

A 比 b 小 的 非 负 整数 《有 效 数字 ) 

一 个 规格 化 的 浮 点 数 x (如果 x 40, MA > 00 由 下 面 的 模型 定义 : 


60 44% 


<float.h> 


FLT ROUNDS 


FLT RADIX 


FLT MANT DIG 
DBL MANT DIG 
LDBL MANT DIG 


FLT DIG 
DBL DIG 
LDBL DIG 


P 
_ e -k 
x=sxb xÝ fi, xb > Ca X EX, 
k=] 


min I 


头 文件 <tloat ho 的 值 中 ，FLT_RADIX 是 一 个 适合 用 在 HE 预 处 理 指令 中 的 常量 表达 
式 ， 其 他 所 有 的 值 都 不 必 是 常量 表达 式 。 除 了 FLT RADIX 和 FLT ROUNDS， 其 他 所 有 的 值 
对 所 有 3 种 浮 点 类 型 都 有 不 同 的 名 字 。 除 了 FLT ROUNDS, 其 他 所 有 的 值 都 由 浮 点 类 型 模 


型 表示 。 


浮 点 加 法 的 舍 人 模式 由 FLT_ROUNDS 的 值 确定 其 对 应 关系 如 下 : 


-1 
0 
1 
2 
3 


不 能 确定 ; 
MOA: 
最 近 舍 入 ; 
BEKKEN: 
向 负 无 穷 大 舍 入 。 


FLT_ROUNDS 的 其 他 所 有 值 都 描述 为 实现 定义 的 全 人 行为 。 


下 面 列 出 的 值 将 被 实现 定义 的 表达 式 代 替 ， 这 些 表 达 式 在 数值 上 〈 绝 对 值 ) 应 该 等 于 
或 者 大 于 给 出 的 值 ， 符 号 相同 。 


指数 表示 的 基数 
FLT RADIX 2 


FLT RADIX 进 制 的 浮 点 数 的 有 效 位 数 p 

FLT MANT DIG 

DBL MANT. DIG 

LDBL MANT DIG 

小 数位 数 9， 满 足 任何 具有 g 个 小 数位 的 浮 点 数 都 可 以 舍 人 到 一 个 具有 pp 个 有 效 
数字 的 5 进 制 数 ， 而 晶 不 用 改动 就 可 以 回 到 g 个 小 数位 ， 


1 WR b EOE 
[(p - Dxlog, dÉ S e 
FLT DIG 6 
DBL DIG 10 
LDBL, DIG 10 


最 小 负 整数 enin WE FOT RADIX 的 (e, 1) KE — VU TCI EP ORC 
FLT MIN EXP 
DBL MIN EXP 
LDBL MIN EXP 


hm log, b"  , f£ 1089 log, b™ SALT SURE LEE AOA. 


FLT MIN 10 EXP -37 
DBL MIN 10 EXP -37 
LDBL MIN, 10 EXP -37 


最 大 整数 eu， 使 FLT_RADIX 的 (ema 1) KE TT ÆR BIER SUC. 
FLT MAX EXP 
DBL MAX EXP 
LDBL MAX EXP 
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。 最 大 整数 log, 1-67 xb’ , få 10 (6) log, 1-67 xb 次 寡 也 在 可 表示 
的 有 限 浮 点 数 的 范围 内 。 


FLT MAX 10 EXP +37 
DBL MAX 10 EXP +37 
LDBL MAX 10 EXP +37 


| 下 而 列 出 的 值 可 以 被 实现 定义 的 表达 式 代替 ， 这 些 表达 式 的 值 等 于 或 者 大 于 那些 给 出 
| 的 值 。 
。 最 大 可 表示 的 有 限 浮 点 数 (1 一 请 )x bm 


FLT MAX 1E+37 
DBL MAX 1E+37 
LDBL MAX 1E+37 


下 而 列 出 的 值 可 以 被 实现 定义 的 表达 式 代 奉 ， 这 些 表 达 式 的 值 等 于 或 者 小 于 那些 给 出 
的 值 。 
e | 和 给 定 的 浮 点 类 型 可 表示 的 比 1 大 的 最 小 值 之 差 ，b"? 


FLT_EPSILON 1E-5 

DBL EPSILON 1E-9 

LDBL EPSILON 1E-9 
e 最 小 的 正 的 规格 化 浮 点 数 pm 

FLT MIN 1E-37 

DBL MIN 1E-37 

LDBL. MIN 1E-37 
例子 


| 下 而 的 例子 描述 了 满足 这 个 国际 标准 最 低 需 要 的 人 工 的 浮 点 数 表 示 和 适合 头 文 件 
<float.h> 中 float 10 MYE. 


6 
x-2sxl6 x V f,x16*, -31 «e <+32 


kel 


FLT_RADIX 16 
FLT_MNAT_DIG 6 
FLT_EPSILON 9.53674316E-07F 
FLT DIG 6 
FLT MIN EXP -31 
FLT MIN 2.93873588E-39F 
FLT MIN 10 EXP -38 
FLT MAX, EXP 432 
FLT MAX 3.40282347E+38F 
FLT MAX 10 EXP +38 


下 面 的 例子 描述 了 满足 ANSI/IEEE 754-1985" 单 精度 和 双 精 度 规 格 化 数 需 要 的 浮 点 数 
表示 ， 和 有 适合 头 文件 <float.h> 中 float Al double 类 型 的 值 。 


24 
x, 25x 2*x V f, x2*, -125 <e <+128 
k=l 


53 
x, «5x2 x V f,x2", -1021 < e< +1024 


k=} 


FLT RADIX 2 
FLT MANT DIG 24 
FLT EPSILON 1.19209290E-07F 
FLT DIG 6 
FLT MIN EXP -125 
FLT MIN 1.17549435E-38F 


FLT MIN 10 EXP -37 
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FLT MAX EXP +128 
FLT_MAX 3.40282347E+38F 
FLT MAX 10 EXP +38 
DBL MANT DIG 53 
DBL EPSILON 2.2204460492503131E-16 
DBL DIG 15 
DBI, MIN, EXP -1021 
DBL, MIN 2.2250738585072014E-308 
DBL MIN 10 EXP -307 
DBL MAX EXP +1024 
DBL_MAX 1.7976931348623157E+308 
DBL_MAX_10_EXP +308 

参见 :条件 包含 (6.8.1)。 

脚注 


10. 浮 点 模型 是 为 了 阐述 每 一 个 浮 点 特征 的 描述 ， 它 不 要 求实 现 的 浮 点 算术 是 一 致 的 。 
11. 标准 中 的 浮 点 模型 从 b 的 零 次 星 进 行 求 和 ， 所 以 指数 范围 的 值 比 这 里 给 出 的 数 小 1. 


4.3 <float.h> 的 使 用 


Ei 


只 有 那些 最 复杂 的 数值 程序 才 会 关心 «tloat.h» 中 定义 的 大 多 数 宏 ， 或 
者 适应 不 同 浮 点 表示 之 间 的 变化 。 我 只 在 某 些 场 合 才 发 现 这 些 参 数 的 用 途 ， 
你 也 只 会 在 库 中 的 某 些 地 方 看 到 它们 的 价值 。 然 而 ， 那 有 点 误导 的 意思 了 。 
在 有 些 地 方 ， 我 使 用 了 <float.h> 中 的 宏 用 到 的 底层 的 宏 〈 见 4.4 节 )。 在 
其 他 的 地 方 ， 这 些 代码 包含 了 某 些 浮 点 参数 的 取 值 范围 或 者 最 大 值 的 隐 含 的 
假设 ， 但 这 又 限制 了 可 移植 性 。 

使 用 这 些 宏 可 以 提前 发 现 某 些 会 造成 影响 的 问题 。 记 住 ， 淫 点 算术 的 3 
个 缺陷 是 上 溢 、 下 溢 和 有 效 值 竺 失 。 这 里 有 几 种 使 用 «£1oat.h» 中 定义 的 宏 
的 方式 ， 它 可 以 让 你 更 加 安全 地 执行 double 型 算术 和 运算。 当然 ， 它 们 也 适用 
F float 和 long double 类 型 。 


为 了 避免 上 溢 ， 一 定 要 保证 所 有 的 值 都 不 会 超过 DBL MAX 的 数值 。 当 
然 ， 像 下 面 这 样 测试 最 终结 果 对 你 没有 任何 好 处 : 


if (DBL MAX < fabs(y)) /* SILLY TEST */ 


(这 里 和 下 面 的 例子 中 出 现 的 函数 都 是 «math. n» 声明 的 一 般 数学 函数 ) 


执行 测试 的 时 候 ， 错 误 已 经 发 生 了 。 如 果 存 储 在 y 中 的 值 太 大 了 而 不 能 
Xm. vy 可 能 会 包含 一 个 特殊 的 代码 : DBL MAX 的 值 或 者 一 个 没 用 的 值 一 一 
这 由 实现 提供 的 浮 点 算术 的 种 类 所 决定 。 或 者 可 能 会 在 计算 这 个 值 的 时 候 终 
止 执行 。 在 任何 情况 下 ， 上 面 的 测试 都 不 会 产生 一 个 有 用 的 结果 。 一 个 更 有 
意义 的 测试 是 : 

if (x < log {DBL MAX)) 

y = expix); 


else 
/* HANDLE OVERFLOW */ 


4.3 <float.h> 的 使 用 03 


可 以 通过 使 用 一 个 相关 的 宏 来 避免 计算 log (DBL MAX), SE, 


if {x <= FLT MAX 10 EXP) 
y = pow(10, x); 
else 
/* HANDLE OVERFLOW */ 


如 果 FLT RADIX 不 等 于 10， 这 个 测试 就 更 有 必要 了 。 (现代 计算 机 通常 
(i rur RADIX 的 值 等 于 2， 或 者 ， 更 少 的 情况 下 ， 等 于 16.) 如 果 要 编写 可 
以 接收 所 有 可 能 的 输入 的 函数 ， 那 就 要 另 当 别论 了 。 和 否则 ， 这 个 测试 已 经 足 
够 严密 了 。 


函数 laexp 使 得 通过 2 的 稼 来 换算 一 个 译 点 数 变 得 很 容易 。 在 
FLT RADIX 等 于 2 的 普遍 情况 下 ， 那 是 一 个 效率 很 高 的 操作 。 对 一 个 整 型 指 
Bn 来 说 ， 可 以 作 以 下 的 简单 测试 : 


if (n < FLT MAX EXP) 
y = ldexp(1.0, n); 
else 
/* HANDLE OVERFLOW */ 


当 你 为 数学 库 编写 附加 的 函数 的 时 候 ， 很 有 可 能 使 用 这 最 后 一 个 测试 。 


Ti 为 了 避免 下 洲 ， 一 定 要 保证 所 有 的 值 都 大 于 等 于 DBL MIN 的 数值 。 下 
溢 的 结果 不 像 上 滋 那 样 损失 惨重 ， 但 是 它 仍然 能 制造 麻烦 。IEEE 754 浮 点 算 
术 提 供 了 渐进 下 溢 (gradual underftlow)， 这 就 减轻 了 下 滋 的 一 些 最 坏 的 影响 。 
几乎 所 有 的 浮 点 实现 都 用 零 值 来 代替 一 个 过 小 而 不 能 表示 的 值 。 只 有 当 除 以 
一 个 会 产生 下 涪 的 值 时 ， 才 会 遇 到 麻烦 。 因 为 令 人 想不到 的 是 ， 你 的 程序 会 
遭遇 到 一 个 零 除数 ， 并 随 之 产生 一 些 混 乱 。 可 以 作 以 下 测试 
if (fabs(y) < DBL MIN) 
/* UNDERFLOW HAS OCCURRED */ 
这 并 不 像 相 应 的 跟 DBL MAX Ay EE SERERE BE, (BTA RARE Hn s 
才 作 检查 。 当 然 ， 也 可 以 作 如 下 相应 的 测试 : 


if. (log(DBL MIN) <= x) 
y = exp(x); 
else 
/* HANDLE UNDERFLOW */ 


if (FLT MIN10 EXP <= x) 
y - pow(10,x); 
else 
T] /* HANDLE UNDERFLOW */ 


if (FLT MIN EXP « n) 
y = ldexp(l.0, n); 
else 
/* HANDLE UNDERFLOW */ 
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第 4 章 


«float.h» 


有 效 值 丢失 


4.4 


其 他 的 宏 


当 对 两 个 几乎 相等 的 值 相 减 时 就 会 发 生 有 效 值 丢 失 ， 这 种 错误 没 法 纠 
正 ， 除 非 在 编写 代码 之 前 仔细 地 分 析 这 个 问题 。 然 而 ， 可 以 阻止 有 效 值 丢失 
的 隐秘 形式 一 一 把 一 个 很 小 的 数 和 一 个 很 大 的 数 相 加 。 一 个 浮 点 数 表示 只 能 
保持 一 个 确定 的 精度 。 央 此 ， 在 加 的 过 程 中 ， 较 小 的 数 的 重要 作用 可 能 就 体 
现 不 出 来 了 。 


例如 ， 求 积分 〈 用 一 些 离散 量 的 总 和 来 近似 地 表示 一 个 连续 的 量 ) 的 时 
候 ， 就 会 陷 人 困境 。 一 种 积分 计算 方法 是 通过 把 曲线 下 面 的 一 系列 矩形 的 面 
积 加 起 来 计算 一 个 曲线 禾 盖 的 面积 。 很 明显 ， 这 些 矩 形 越 窄 ， 它 们 的 和 就 越 
跟 曲 线 获 盖 的 面积 接近 。 但 不 幸 的 是 ， 这 只 在 理论 上 成 立 。 把 一 个 非常 小 的 
矩形 面积 加 到 当前 的 和 中 ， 它 的 部 分 或 者 全 部 作用 就 无 法 体 更 。 例 如 ， 可 以 
通过 下 面 的 代码 测试 一 下 ，x 和 y 相 加 是 否 会 使 y 的 至 少 3 个 十 进 制 有 效 位 
ER BAH A ABA ERO: 

if (x < y* DBL_EPSILON* 1.0E+03) 

- /* HANDLE SIGNIFICANCE LOSS */ 

最 不 可 能 用 到 的 两 个 宏 是 FLT RADIX 和 FLT_ROUNDS。 事 实 上 ， 虽 然 我 
在 这 里 简单 地 总 结 了 一 下 ， 但 如 果 你 从 来 没有 机 会 使 用 <f1oat.h> 中 定义 的 
任何 宏 ， 也 不 要 感到 奇怪 。 


你 应 该 对 浮 点 算术 的 特性 和 缺陷 有 所 了 解 ， 也 应 该 知道 可 移植 的 C 代码 
和 为 日 常 使 用 的 机 器 编写 的 代码 中 浮 点 值 的 安全 范围 和 精度 。 你 可 能 会 使 用 
«£loat.h» 中 定义 的 一 些 宏 来 将 安全 检查 固定 到 你 的 代码 中 。 但 是 ， 不 要 认 
为 这 个 头 文件 包含 了 编写 高 度 可 移植 代码 的 关键 因素 ， 因 为 它 并 没有 。 
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原则 上 ， 这 个 头 文件 除了 一 串 宏 定 义 ， 其 他 什么 都 没有 。 对 于 一 个 特定 
的 实现 ， 只 不 过 是 确定 一 下 参数 的 值 并 把 它们 加 进去 ， 甚 至 可 以 使 用 一 个 叫 
做 enquire 的 免费 程序 来 自动 地 生成 <f1oath>。 

对 于 浮 点 算术 来 说 ， 近 年 来 常用 的 实现 都 以 IEEE 754 标准 为 基础 。 你 将 
发 现在 Intel 80X87 和 Motorola MC680X0 协 处 理 器 下 的 IEEE 754 浮 点 算术 ， 
只 有 两 个 常用 的 文本 行 命名 。 它 是 一 个 复杂 的 标准 ， 但 是 只 有 它 的 总 体 属性 
影响 着 <float.h>。 在 IEEE 754 ÅRET, long double 类 型 可 以 有 一 个 80 位 
的 表示 ， 但 它 经 常 和 double 类 型 有 相同 的 表示 。 在 这 种 普遍 的 情况 下 ， 可 以 
考虑 把 C 标准 的 例子 中 的 值 复制 出 来 (参考 4.2 节 )。 

然而 ， 你 可 能 会 发 现 一 些 问题 ， 并 不 是 所 有 的 翻译 器 都 擅长 转换 浮 点 常 
数 。 有 些 会 固定 最 低 有 效 位 或 者 两 个 有 效 位 。 在 某 些 极 限 值 ( 例 如 DBL MAX 
和 DBL_MIN) 的 情况 下 ， 那 就 可 能 产生 溢出 ， 或 者 可 能 会 破坏 其 他 值 〈 例 如 
DBL EPSILON) 的 关键 行为 。 


使 用 联合 


参数 
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所 以 ， 我 们 至 少 应 该 检查 浮 点 值 产生 的 位 模式 。 可 以 通过 把 这 个 值 以 一 
种 方式 添加 到 一 个 联合 中 ， 然 后 以 另 一 种 方式 把 它 提 取出 来 以 实现 上 述 的 检 
zr, fin. 


union ( 
double D: 
unsigned short _Us[4]: 
) dmax - DBL MAX; 
这 里 假设 unsigned short 占据 16 (i, double 是 IEEE 754 fff) 64 fi X 
示 。 有 些 计算 机 把 最 高 有 效 字 存储 在 dmax. Us[0] 中 ， 其 他 的 存储 在 
dmax. Us[3] 中 。 你 必须 检查 你 的 实现 做 了 什么 。 不 管 是 哪 种 情况 ， 最 高 有 
效 字 的 值 应 该 等 于 0x7FEF， 所 有 其 他 字 的 值 应 该 等 于 0xFFFF。 


一 个 更 加 安全 的 方法 和 它 很 相似 。 把 联合 初始 化 为 一 个 位 模式 的 序列 ， 
然后 定义 这 个 宏 并 通过 联合 的 一 个 浮 点 成 员 访 问 该 联合 。 因 为 只 能 初始 化 联 
合 的 第 一 个 成 员 ， 所 以 必须 把 上 面 例子 中 的 成 员 声明 顺序 颠倒 过 来 。 用 这 种 
方法 ， 可 以 把 下 面 的 代码 放 人 <float.h>: 


typedef union { 
unsigned short _Us[4]; 


double _D; 

} _Dtype; 
extern _Dtype _Dmax, _Dmin, _Deps; 
#define DBL_MAX  Dmax. D; 


在 一 个 库 的 源 文件 中 ， 要 提供 Dmax 和 其 他 相关 的 定义 。 对 于 先 存储 最 
低 有 效 字 的 80X86 系列 ， 可 以 编写 : 

#include <float.h> 

_Dtype Dmax = ((Oxffff, Oxffff, Oxffff, Ox7fef}}; 

这 些 代码 现在 不 太 容易 读 懂 ， 但 它 非常 健壮 。 图 4-1 显示 了 随 之 产生 
的 float.h 版 本 。 每 一 个 宏 都 能 够 引用 3 个 类 型 为 _pvals 一 _Dbl、_Fit 和 
—Ldbl 的 数据 对 象 中 的 一 个 。 一 个 名 为 xfloat.c 的 文件 定义 了 这 些 数 据 对 象 。 


在 编写 这 些 相应 的 数据 对 象 的 时 候 ， 我 遇 到 了 另 一 个 问题 : 不 同 的 浮 
点 格式 ， 要 求 不 同 的 初始 化 。 即 使 遵循 IEEE 754 标准 ， 不 论 long double 
占据 64 位 还 是 80 位 ， 都 必须 指明 存储 在 一 个 数据 对 象 中 的 字 节 的 顺序 。 
FLT RADIX 等 于 2 的 其 他 格式 只 在 一 些 细小 的 方面 有 所 不 同 。 


现在 我 们 需要 再 一 次 确定 编码 的 参数 。 在 3.4 节 ， 我 介绍 了 内 部 头 文件 
<yvals.h>， 把 那些 随 翻 译 器 变化 的 参数 放 在 该 文件 中 。 错 误 编 码 是 这 样 的 
参数 的 一 个 集合 ， 浮 点 表示 的 属性 构成 了 另 一 个 集合 。 如 果 一 个 库 的 源 文件 
在 C 的 不 同 实现 中 必须 在 某 些 细小 的 方面 作 些 改变 ， 那 么 就 可 以 在 这 些 库 的 
源 文 件 中 包含 <yvals.h>。 


«float.h» 


/* float.h standard header -- IEEE 754 version */ 
#ifndef FLOAT 
#define FLOAT 
#ifndef  YVALS 
finclude <yvals.h> 
fendif 
/* type definitions */ 
typedef struct ( 
int _Ddig, Dmdig, Dmaxl0e, Dmaxe,  DminlOe, 
union ( 
unsigned short Us[5]; 
float F; 
double D: 
long double Ld; 
) Deps,  Dmax, _Dmin; 
)  Dvals; 
/* declarations */ 
extern Dvals Dbl, Flt,  Ldbl; 
/* double properties */ 


#define DBL DIG  Dbl. Ddig 
#define DBL EPSILON .Dbl. Deps. D 
#define DBL MANT DIG Dbl. Dmdig 
#define DBL MAX .Dbl.. Dmax.. D 
#define DBL MAX 10 EXP Dbl. Dmaxi0e 
#define DBL MAX EXP .Dbl. Dmaxe 
#define DBL MIN .Dbl. Dmin. D 
#define DBL MIN 10 EXP Dbl. DminlOe 
#define DBL MIN EXP .Dbl. Dmine 

/* float properties */ 
#define FLT DIG .Flt. Ddig 
#define FLT EPSILON  Flt. Deps. P 
#define FLT MANT DIG .Flt. Dmdig 
#define FLT MAX .Flt. Dmax. F 
#define FLT MAX 10 EXP _Flt._Dmaxl0e 
#define FLT MAX EXP  Flt. Dmaxe 
#define PL MIN  Flt. Dmin. P 
#define FLT MIN 10 EXP  Flt. DminiOe 
#define FLT MIN EXP .Flt. Dmine 

/* common properties */ 
#define FLT RADIX 2: 
#define FLT ROUNDS _FRND 

/* long double properties */ 
#define LDBL_DIG _Labl._Ddig 
#define LDBL_EPSILON _Ldb1._Deps._Ld 
#define LDBL MANT DIG _lLdbl._Dmdig 
#define LDBL MAX  Låbl. Dmax. Ld 
#define LDBL MAX 10 EXP Ldbl. Dmax10e 
#define LDBL MAX EXP  Ldbl. Dmaxe 
#define LDBL MIN .Ldbl. Dmin. Ld 


#define LDBL MIN 10 EXP Ldbl. Dminl0e 


#define LDBL MIN EXP Ldbl. Dmine 
#endif 


_Dmine; 
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«yvals.h» 定义 了 下 面 的 参数 : 
DO D _DO 是 用 来 表示 double 值 的 由 4 个 unsigned short 类 型 组 成 的 数组 
的 最 高 有 效 元 素 的 下 标 。 它 的 值 不 是 0 就 是 3。( 具 有 其 他 3 个 下 标 
(_D1，_D2 和 -_D3) 的 宏 在 DO 的 基础 上 定义 ， 它 们 在 库 的 其 他 地 


方 会 被 用 到 。) 
.DOFF C _DOFF 是 最 高 有 效 少数 元 素 中 的 小 数位 FFF... 的 个 数 。 该 元 素 的 最 
_FOFF 高 有 效 位 是 浮 点 值 的 符号 s， 值 为 0 或 者 1。 其 他 的 位 作为 一 个 无 
_LOFF 符号 位 域 表 示 特 征 值 coc.... BSA 4-2 double 类 型 表示 的 格式 。 


_FOFF 是 float 类 型 的 相应 值 。_LOFF 是 long double 类 型 的 相应 值 。 
_DBIAS C) _DBIAS 是 一 个 从 double 的 特征 值 中 减 掉 的 以 确定 它 的 指数 的 
-FBIAS få. _FBIAS H float 2$ XJ Bj 4H hv AY f. _LBIAS 是 long double 类 
_LBIAS 型 的 相应 的 值 。 小 数值 F 是 1.FFF... (float Ål double 型 ) 或 者 
O.FFF... (IEEE 754 80 位 格式 的 long double 型 )， 在 这 里 FFF... 是 
小 数位 。 那 么 ， 一 个 double 数 的 值 为 : 


-1* * (1.FFF...) * 2 ieee (0) DBIAS . 
_DLONG CJ 如 果 long double 具有 IEEE 754 的 80 位 格式 ， 那 么 DLONG 为 非 零 。 
. FRND C] FRND 是 宏 FLT ROUNDS 的 值 。 
xfloat.c 图 4-3 显示 了 xfloat.c 的 代码 ， 它 是 在 这 些 参 数 的 基础 上 编写 的 。 这 


段 代码 也 包含 了 一 些 隐 含 的 假设 : 
C) FLT_RADIX 的 值 为 2。 
口 float 类 型 为 32 位 表示 ， 并 且 一 定 和 含有 两 个 wnsigned short 类 型 的 
RAGS, fii double 类 型 为 64 位 表示 ， 一 定 与 由 4 个 unsigned short 
类 型 的 数组 重 谷 。 | 
O AA DLON 为 非 零 时 ，long double 类 型 才 具 有 IEEE 754 的 80 位 表 
zm; 否则 ， 它 和 double 的 表示 相同 。 
口 特征 值 的 位 数 绝 不 会 比 14 更 大 。 
O float 或 者 double 中 的 小 数值 中 包含 一 个 隐藏 位 ， 该 位 就 是 上 面 提 到 
的 FFF... 之 前 的 那个 1。 
作为 一 个 例子 ， 下 面 给 出 Intel 80X87 协 处 理 器 的 相关 值 ， 这 里 假设 
double 和 long double 具有 不 同 的 表示 : 


#define DO 3 
#define _DBIAS 0x3fe 
#define _DLONG 工 
#define _DOFF 4 
#define _FBIAS Ox7e 
#define _FOFF 7 
#define  FRND 1 
#define LBIAS Ox3ffe 
#define _LOFF 15 


图 4-2 SCCCCCCCCCCCFFFF FFFF....FFFF FFFF....FFFF FFFF....FFFF 


double 格式 x. Us[ DO] x. Usf Dl] x. Us[ D2] x. Us[ D3] 
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图 4-3 [7* values used by «float.h» macros -- IEEE 754 version */ 
xfloat.c Hinclude «float.h» 


/* macros */ 
#define DFRAC (49+ DOFF) 
#define DMAXE ((1U««(15- DOFF))-1) 
#define FFRAC (174 FOFF) 
#define FMAXE ((1U««(15-. FOFF))-1) 
#define LFRAC (49+ LOFF) 
fidefine LMAXE Ox7fff 
#define LOG2 0.30103 
#if_DO != 0 /* low to high words */ 
#define DINIT(wO, wx) wx, wx, wx, w0 
#define FINIT(w0, wx) wx, w0 
#define LINIT(wO, wl, wx) wx, wx, wx, wl, w0 
Helse /* high to low words */ 
#define DINIT(wO, wx) w0, wx, wx, wx 
#define FINIT(w0, wx) w0, wx 
#define LINIT(wO, wl, wx) wO, wl. wx, wx, WX 
Hendif 
/* static data */ 
_Dvals _Dbl = { 


(int) ((DFRAC-1)*LOG2), /* DBL_DIG */ 
(int )DFRAC, /* DBL MANT DIG */ 
(int) ((DMAXE- DBIAS-1)*LOG2), /* DBL MAX 10 EXP */ 
(int) (DMAXE- DBIAS-1), /* DBL MAX EXP */ 
(int) (-  DBIAS*LOG2), /* DBL MIN 10 EXP */ 
(int) (1- DBIAS), /* DBL MIN EXP */ 
(DINIT( DBIAS-DFRAC+2<< DOFF, 0)}, /* DBL EPSILON */ 
(DINIT((DMAXE«« DOFF)-1, -0)), /* DBL MAX */ 
(DINIT(1«« DOFF, 0)}, /* DBL MIN */ 


nn 
_Dvals _Flt ={ 


(int) ((FFRAC-1)*L0G2), /* FLT DIG */ 
(int)FFRAC, /* FLT MANT DIG */ 
(int) ( (FMAXE-_FBIAS-1)*LOG2), /* FLT MAX 10 EXP */ 
. (int) (FMAXE- FBIAS-1), /* FLT MAX EXP */ 
(int) (- FBIAS*LOG2), /* FLT MIN 10 EXP */ 
(int) (1- FBIAS), /* FLT MIN EXP */ 
(FINIT( FBIAS-FFRAC*2«« FOFF, 0)}, /* FLT EPSILON */ 
(FINIT((FMAXE«« FOFF)-1,-0)), /* FLT MAX */ 
(FINIT(l«« FOFF, 0)), /* FLT MIN */ 


E 
#if _DLONG 
_Dvals _Ldbl = { 


(int) ((LFRAC-1)*LOG2), /* LDBL DIG */ 
(int) LFRAC, /* LDBL_MANT_DIG */ 
(int) ( (LMAXE-_LBIAS-1)*LOG2), /* LDBL MAX 10 EXP */ 
(int) (LMAXE- LBIAS-1), /* LDBL MAX EXP */ 
(int) (- LBIAS*LOG2), 、 /* LDBL MIN 10 EXP */ 
(int) (1- LBIAS), /* LDBL MIN EXP */ 
(LINIT( LBIAS-LFRAC+2, 0x8000, 0)}, /* LDBL EPSILON */ 
{LINIT(LMAXE-1, -0, ~0)},° /* LDBL MAX */ 


{LINIT(1, 0x8000, 0)}, /* LDBL MIN */ 
I; 
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图 4-3 #else 
(GE) _Dvals Labl = { 

(int) (DFRAC*LOG2), /* LDBL_DIG */ 
(int) DFRAC, /* LDBL MANT DIG */ 
(int) ((DMAXE- DBIAS-1)*LOG2), /* LDBL MAX 10 EXP */ 
(int) (DMAXE- DBIAS-1), /* LDBL MAX EXP */ 
(int) (- DBIAS*LOG2), /* LDBL MIN 10 EXP */ 
(int) (1- DBIAS), /* LDBL MIN EXP */ 
{DINIT (_DBIAS-DFRAC+2<<_DOFF,0)}, /* LDBL_EPSILON */ 
{DINIT ( (DMAXE<<_DOFF)-1,~0)}, /* LDBL_MAX */ 
{DINIT(1<<_DOFF, 0)}, /* LDBL MIN */ 
}; 

#endif 


口 
45 «loat.bo 的 测试 D 


图 4-4 显示 了 测试 程序 tt loat.c。 程 序 一 开始 就 输出 «£loat.n» 中 定 
义 的 宏 的 值 ， 而 且 输 出 方式 便于 理解 。 然 后 ， 它 检查 这 些 宏 是 否 满足 C 标准 


描述 的 最 低 要 求 。 
EISE Intel 80X87 协 处 理 器 在 一 个 实现 下 的 输出 ， 该 实现 支持 所 有 3 种 
大 小 的 IEEE 754 操作 数 。 
FLT RADIX = 2 
DBL DIG = 15 DBL, MANT DIG - 53 
DBL MAX 10 EXP - 308 DBL, MAX EXP - 1024 
DBL MIN 10 EXP - -307 DBL MIN EXP - -1021 
DBL, EPSILON - 2.220446e-16 
DBL MAX = 1.797693e+308 
DBL MIN = 2.225074e-368 
FLT_DIG = 6 FLT_MANT_DIG = 24 
FLT_NAX_10_EXP = 38 FLT_MAX_EXP = 128 
FLT_MIN_10_EXP = -37 FLT_MIN_EXP = | -125 
FLT EPSILON - 1.192093e-07 
FLT MAX - 3.402823e+38 
FLT MIN = 1.175494e-38 
LDBL DIG = 19 LDBL MANT DIG = 64 
LDBL MAX 10 EXP = 4932 LDBL MAX EXP = 16384 
LDBL MIN 10 EXP = -4931 LDBL MIN EXP = -16381 
LDBL EPSILON = 1.084202e-19 
LDBL MAX - 1.189731e+4932 
LDBL MIN = 3.362103e-4932 


SUCCESS testing <float.h> 


在 开发 <float.h> 和 xfloat.c 的 过 程 中 ， 我 没有 发 现任 何 错误 。 大 部 
分 错误 都 是 通过 运行 thloat.c 才 发 现 的 。 因 而 这 些 测试 其 实 并 不 简单 。 
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tfloat.c | #include <assert.h> 


#include <float.h> 
#include <math.h> 
#include <stdio.h> 


int main() 


{ /* test basic properties of float.h macros */ 


double radlog; 
int digs; 
static int radix = FLT RADIX; 


printf("FLT RADIX = $iWnin",FLT RADIX); 

printf("DBL DIG - $5i DBL MANT DIG = %6i\n", 
DBL DIG, DBL MANT DIG); 

printf("DBL MAX 10 EXP = $5i DBL MAX EXP = %6i\n", 
DBL MAX 10 EXP, DBL MAX EXP); l 

printf("DBL MIN 10 EXP = $5i DBL MIN EXP = %6i\n", 
DBL MIN 10 EXP, DBL MIN EXP); 


printf(" DBL EPSILON = $%le\n", DBL EPSILON); 

printf(" DBL MAX - $le\n", DBL MAX); 

printf(" DBL MIN - Sle\n\n", DBL MIN); 

printf("FLT DIG - %5i FLT MANT DIG = $6i\n", 
FLT_DIG, FLT MANT DIG); 

printf("FLT MAX 10 EXP = %5i FLT MAX EXP = %6i\n", 
FLT MAX 10 EXP, FLT MAX EXP); 

printf("FLT MIN 10 EXP - $5i FLT MIN EXP - $6i\n", 

FLT MIN 10 EXP, FLT MIN EXP); 

printf(" FLT EPSILON = %e\n", FLT EPSILON); 

printf(" FLT MAX - Senn, FLT MAX); 

printf(" FLT MIN - %e\n\n", FLT MIN): . 

printf("LDBL DIG- $5i LDBL, MANT DIG - %6iln", 


LDBL DIG, LDBL MANT DIG); 
printf("LDBL MAX 10 EXP = %5i LDBL MAX EXP = %6i\n", 
LDBL MAX 10, EXP, LDBL MAX EXP); 
printf("LDBL MIN 10 EXP - $5i LDBL MIN EXP = %6i\n", 
LDBL MIN 10, EXP, LDBL MIN EXP); 


printf(" LDBL EPSILON - %Leln", LDBL EPSILON); 
printf(" LDBL, MAX - %Le\n", LDBL MAX); 
printf(" LDBL MIN - %Le\n", LDBL MIN); 


radlog = logi10 (radix); 
/* test double properties */ 
assert(10 «- DBL DIG && FLT DIG «- DBL, DIG); 
assert(DBL EPSILON <= le-9); 
digs - (DBL MANT DIG - 1) * radlog; 
assert(digs «- DBL DIG && DBL DIG <= digs + 1); 
assert (le37 <= DBL MAX); 
assert(37 «- DBL MAX 10 EXP); 
Hif FLT RADIX == 
assert(ldexp(1.0, DBL MAX EXP - 1) « DBL MAX); 
assert(ldexp(1.0, DBL MIN EXP _ 1) == DBL MIN); 
#endif 
assert (DBL_MIN <= le-37); 


assert(DBL MIN 10 EXR <= -37); 
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Fd 4-4 /* test float properties */ 
(E) assert(6 «- FLT DIG); 
. assert(FLT EPSILON <= le-5); 
digs - (FLT MANT DIG - 1) * radlog; 


assert(digs «- FLT DIG && FLT DIG «- digs « 1); 
assert(1e37 <= FLT MAX); 
assert(37 «- FLT MAX 10 EXP); 
dif FLT RADIX == 
assert(ldexp(1.0, FLT MAX EXP - 1) « FLT MAX); 
assert(ldexp(1.0, FLT MIN EXP - 1) == FLT MIN); 
fendif 
assert (FLT MIN <= le-37); 
assert (FLT MIN 10 EXP <= -37); 
/* test universal properties */ 
#if FLT RADIX < 2 
#error bad FLT RADIX 
fendif 
assert(-1 <= FLT ROUNDS && FLT_ROUNDS <= 3); 
/* test long double properties */ 
assert (10 «- LDBL DIG && DBL DIG «- LDBL DIG); 
assert(LDBL EPSILON «- 1e-9); 
digs - (LDBL MANT DIG - 1) * radlog; 
assert(digs <= LDBL DIG && LDBL DIG «- digs + 1); 
assert(1e37 «- LDBL, MAX); 
assert(37 <= LDBL MAX 10 EXP); 
if FLT RADIX == 
assert(DBL MAX EXP « LDBL MAX EXP 
Ir ldexp(1.0, LDBL MAX EXP - 1) < LDBL MAX); 
assert(LDBL MIN EXP « DBL MIN EXP 
|| ldexp(1.0, LDBL MIN EXP - 1) == LDBL MIN); 


fendif 
assert (LDBL MIN <= le-37); 
assert (LDBL MIN 10 Exp <= -37); 
puts("SUCCESS testing «float.h»"); 
return(0); 


} 口 
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4.1 


4.2 


4.3 


4.4 


4.5 


4.6 


4.7 


4.8 


D 程序 paranoia 可 以 测试 出 浮 点 运算 中 的 很 多 错误 。 它 最 早 由 加 利 福 尼 亚 
大 学 伯克利 分 校 〈the University of California at Berkeley) 的 W.M.Kahan 
编写 。 现 在 也 有 了 C 版 本 。 你 可 以 向 netliberesearch.att.com 发 出 以 
下 请 求 : 


send paranoia.c from paranoia 


Pat Sterbenz, Floating-Point Computation (Englewood Cliffs, N.J.: Prentice-Hall, 
Inc., 1973). 这 本 书 很 老 了 而 且 现 在 已 经 不 出 版 了 。 然 而 ， 关 于 这 些 基 本 问题 
的 讨论 ， 很 难 找到 比 这 更 好 的 书 了 。 : 


为 你 使 用 的 C 翻译 器 确定 描述 浮 点 运算 的 参数 ， 它 们 和 IEEE 754 标准 一 致 吗 ? 
你 可 以 修改 <yvals.h> 以 使 它 适应 你 使 用 的 C 翻译 器 上 的 <float.h> 和 
xfloat.c Hy? 如果 可 以 ， 就 去 试 一 下 ， 如 果 不 能 ， 还 必须 修改 其 他 的 什么 
东西 吗 ? 

考虑 下 面 的 代码 : 


double d = 1.0; 
float a [N]; 


for(i = 0; i < n; ++i) 
d *- a [il ; 


fr IEEE 754 浮 点 算术 中 ， 在 a 的 计算 溢出 之 前 ，N 最 大 是 多 少 ? 
考虑 下 面 的 代码 : 


long double id = 1.0; 
double a [N]; 


for(i = 0; i < n; ++i) 


ld *- a[i]; 
TE IEEE 754 浮 点 算术 中 ， 在 ld 的 计算 结果 溢出 之 前 ，N 最 大 是 多 少 ? 
为 什么 <yvals .n> 直接 包含 在 <float.h> 中 (而 不 是 只 包含 在 xfloat.c 
H) ? 修改 本 章 中 的 代码 来 消除 这 种 需要 。 
给 定 函 数 int_Getrnd(void)， 它 可 以 返回 当前 的 浮 点 舍 和 状态。 修改 宏 
FLT_RADIX 来 返回 当前 状态 。 
[ 难 ] 编写 一 个 C 程序 ， 使 它 仅 通过 使 用 算术 运算 就 能 确定 <float.h> 定义 
的 所 有 宏 的 值 。 假 设 你 不 知道 底层 的 浮 点 数 表 示 。 
[ 很 难 ] 修改 上 题 中 的 程序 ， 使 它 可 以 在 某 个 实现 下 安全 地 工作 ， 该 实现 遇 到 
浮 点 数 溢出 时 会 异常 终止 程序 。 假 设 一 旦 发 生 溢出 ， 程 序 就 不 能 重新 获得 控 
制 权 。 
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背景 知识 


历史 


为 变化 的 
东西 命名 


对 C 程序 设计 语言 的 所 有 部 分 进行 标准 化 的 第 一 次 尝试 开始 于 1980 年 ， 
它 是 由 一 个 当时 称 作 /usrvgroup， 现 在 叫 UniForum 的 组 织 发 起 的 。 作 为 第 一 
个 发 展 UNIX 的 商业 性 的 组 织 ，/usr/group 对 厂商 独立 标准 的 形成 有 着 重大 影 
响 。 这 个 组 织 感觉 到 了 技术 的 发 展 不 能 简单 地 向 各 个 方向 进行 ， 他 们 也 不 能 
只 单一 地 为 AT&T 服务 ， 因 为 这 两 种 方式 都 很 难 维持 一 个 开放 性 的 市 场 。 


所 以 /usr/group 开始 了 定义 UNIX 和 类 UNIX 系统 的 具体 含义 的 过 程 。 
他 们 成 立 了 一 个 标准 委员 会 ， 这 个 委员 会 至 少 在 刚 开 始 的 时 候 专注 于 C 编程 
环境 。 总之， 几乎 所 有 的 应 用 程序 都 在 该 环境 下 实现 。 他 们 的 目标 是 描述 很 
多 C 函数 ， 这 些 函 数 可 以 在 任何 UNIX 可 兼容 的 系统 中 找到 。 当 然 ， 这 些 描 
述 必须 独立 于 任何 特定 的 体系 结构 。 


/usr/group 的 描述 中 一 部 分 是 允许 访问 UNIX 系统 服务 的 、C 可 调用 的 函 
数 集 。 不 过 ， 更 大 一 部 分 是 对 所 有 的 C 环境 都 适用 的 函数 集 ， 这 一 部 分 是 C 
标准 中 库 的 基础 。 因 为 Kernighan 和 Ritchie 选择 不 去 专门 讨论 库 ， 只 是 必要 
时 顺便 提 一 下 ， 所 以 /usr/group 标准 极 大 地 帮助 了 X3J11 委员 会 ， 为 我 们 节 
省 了 很 多 个 月 甚至 几 年 的 额外 劳动 。 


另外 ，/usr/group 的 成 果 还 有 一 个 很 有 用 的 目的 。IEEE 委员 会 1003 的 成 
立 是 为 了 把 这 个 工业 产品 转变 成 一 个 官方 的 标准 。IEEE 小 组 把 系统 独立 函数 
部 分 的 责任 转交 给 了 X3J11, m 自己 则 专注 于 UNIX 特定 的 部 分 。 因 而 ， 就 
有 了 今天 的 IEEE 1003.1 标准 ， 也 叫做 POSIX。 


要 构建 一 个 体系 结构 独立 的 描述 ， 一 部 分 工作 就 是 找 出 不 同 的 计算 机 体 
系 结构 之 间 有 哪些 发 生 了 变化 。 固 然 ， 我 们 希望 避免 一 切 不 必要 的 变化 ， 然 
后 剩 下 的 就 是 要 识别 和 限制 的 部 分 了 。 当 一 个 应 用 程序 移 到 另 一 种 类 型 的 
UNIX 下 的 时 候 ， 某 个 关键 的 值 可 能 会 改变 。 所 以 ， 要 对 该 值 进行 命名 。 要 
制定 程序 中 测试 该 值 的 规则 。 而 且 要 定义 该 值 的 变化 范围 。 


C 中 的 一 个 优良 传统 是 标量 数据 类 型 要 以 一 种 对 每 个 计算 机 体系 结构 都 
很 自然 的 方式 表示 。 基 本 类 型 int 的 弹性 很 大 ， 它 希望 自己 的 大 小 至 少 在 一 
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个 很 宽 的 范围 内 能 支持 高 效 的 计算 。 这 对 效率 来 说 可 能 是 个 不 错 的 选择 ， 但 
针对 可 移植 性 来 说 ， 就 真 的 是 个 麻烦 了 。 


/usr/group 发 明了 标准 头 文件 <limits.h> 来 捕捉 很 多 在 计算 机 体系 结构 
之 间 变 化 的 重要 特性 。 碰 巧 ， 这 个 头 文件 又 专门 地 处 理 整 数值 的 变化 范围 。 
34 X3J11 决定 为 浮 点 类 型 加 入 一 些 相 似 的 数据 的 时 候 ， 我 们 通过 投票 决定 不 
A m <limits.h> 中 已 经 存在 的 内 容 ， 而 是 添加 了 标准 头 文件 <float.h>. 
也 许 我 们 也 应 该 把 这 个 已 经 存在 的 头 文件 改名 为 <integer.h>， 但 是 我 们 没 
有 这 样 做 。 因 为 历史 的 连贯 性 战胜 了 格式 的 整齐 。 
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«limits.h» 


CHAR BIT 


SCHAR MIN 


SCHAR MAX 


UCHAR MAX 


CHAR MIN 


CHAR MAX 


MB LEN MAX 


SHRT MIN 


SHRT MAX 


USHRT MAX 


INT MIN 


INT MAX 


5.2.4.2 数字 范围 


一 个 符合 标准 的 实现 应 该 记录 本 条 目 指定 的 所 有 的 范围 ， 它 们 将 在 头 文件 <limits.h> 
和 <f loat. h> 中 详细 说 明 。 


5.2.4.2.1 整 值 类 型 的 大 小 «limits.h» 


下 面 给 出 的 值 会 被 适合 在 杜 E 预 处 理 指令 中 使 用 的 常量 表达 式 代替 。 而 且 ， aT 
CHAR BIT 和 MB_LEN_MAX 之 外 ， 后 面 的 都 会 被 类 型 与 根据 整 值 提升 而 转换 的 具有 相应 
的 对 象 类 型 相同 的 表达 式 赫 换 。 它 们 的 实现 定义 的 值 在 数值 上 〈 绝 对 值 ) 会 大 于 等 于 此 
给 出 的 值 ， 符 号 相同 。 
e 除 位 域 之 外 的 最 小 对 象 的 位 数 〈 字 节 
CHAR BIT 8 
e signed char 类 型 的 对 象 的 最 小 值 
SCHAR, MIN -127 
e signed char 类 型 的 对 象 的 最 大 值 
SCHAR MAX +127 
e unsigned char 类 型 的 对 象 的 最 大 值 
UCHAR MAX 255 
e char 类 型 的 对 象 的 最 小 值 
CHAR MIN “ 见 下 面 ” 
e char 类 型 的 对 象 的 最 大 值 
CHAR_MAX “ 见 下 面 ” 
e 任何 支持 区 域 设 置 的 多 字 节 字符 的 最 大 字 节 数 
MB LEN, MAX 1 
e short int 类 型 的 对 象 的 最 小 值 
‘SHRT_MIN -32767 
e short int 类 型 的 对 象 的 最 大 值 
SHRT MAX +32767 
e unsigned short int 类 型 的 对 象 的 最 大 值 
USHRT MAX 65535 
e int 类 型 的 对 象 的 最 小 值 
INT_MIN -32767 
e int 类 型 的 对 象 的 最 大 值 


INT MAX +32767 
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UINT MAX 


LONG MIN 


LONG MAX 


ULONG MAX 


e unsigned int 类 型 的 对 象 的 最 大 值 


UINT MAX 65535 

。 long int 类 型 的 对 象 的 最 小 值 
LONG_MIN -2147483647 

* long int 类 型 的 对 象 的 最 大 值 
LONG MAX +2147483647 

e unsigned long int 类 型 的 对 象 的 最 大 值 
ULONG, MAX 4294967295 


如 果 一 个 char 类 型 的 对 象 在 一 个 表达 式 中 被 作为 一 个 有 符号 整数 对 待 ， 那 么 
CHAR, MIN 的 值 就 和 SCHAR_MIN 的 相同 ，CHAR_MAX 的 值 也 会 和 SCHAR MAX 的 相同 。 耕 则 ， 
CHAR MIN 的 值 就 为 0，CHAR_MAX 的 值 就 和 UCHAR MAX 的 相同 ^. 

脚注 

9, 参考 6.1.2.5。 


5.3 «limits.h» 的 使 用 


类 型 适应 


可 以 通过 两 种 方式 来 使 用 <limits.h>。 其 中 简单 点 的 方法 可 以 保证 你 不 
会 编写 出 一 个 可 笑 的 程序 。 例 如 ， 假 设 要 表示 某 个 值 在 VAL MIN 和 VAL MAX 
之 间 的 有 符号 数据 ， 就 可 以 通过 写 以 下 代码 来 防止 程序 出 现 翻译 错误 ， 


#include «assert.h» 
#include <limits.h> 


fif VAL MIN < INT MIN || INT MAX < VAL MAX 
terror values out of range 
#endif 


然后 就 可 以 安全 地 把 数据 存储 在 声明 为 int 型 的 数据 对 象 中 。 


使 用 «1imits.h» 的 一 种 更 加 复杂 的 方法 是 控制 一 个 程序 中 的 类 型 选择 。 
可 以 把 上 面 的 例子 改 为 : 
#include <assert.h> 
#include <limits.h> 
#if VAL MIN < INT MIN || INT MAX < VAL MAX 
typedef long Val t; . 
felse 


typedef int Val t; 
#endif 


然后 就 可 以 把 所 有 在 这 个 范围 内 变化 的 数据 对 象 声 明 为 valt 类 型 。 程 序 就 
会 选择 效率 更 高 的 类 型 。 

«limits.h» 的 出 现 也 是 为 了 废除 一 种 老 的 、 可 移植 性 非常 差 的 编程 方 
法 。 一 些 程序 尝试 通过 编写 #if 预 处 理 指令 来 测试 执行 环境 的 属性 : 


Sif (-1 + 0x0) >> 1 > Ox7fff 
/* must have ints greater than 16 bits */ 


#endif 
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RI 5-1 /* limits.h standard header -- 8-bit version */ 
limits.h #ifndef LIMITS 


#define | LIMITS 
#ifndef _YVALS 
#include <yvals.h> 


fendif 

/* char properties */ 
#define CHAR BIT 8 
dif _CSIGN 
*define CHAR MAX 127 
#define CHAR MIN (-127- C2) 
#else 
#define CHAR MAX 255 
#define CHAR MIN 0 
#fendif 

/* int properties */ 
#if | ILONG 
#define INT MAX 2147483647 
#define INT MIN (-2147483647- C2) 
#define UINT MAX 4294967295 
felse 
#define INT MAX 32767 
#define INT MIN (-32767- C2) 
#define UINT MAX 65535 
#endif 

/* long properties */ 
#define LONG MAX 2147483647 
#define LONG MIN (-2147483647- C2) 


/* multibyte properties */ 
#define MB LEN MAX | MBMAX 
/* signed char properties */ 


#define SCHAR MAX 127 
#define SCHAR MIN (-127- C2) 
/* short properties */ 
#define SHRT MAX 32767 
#define SHRT MIN (-32767- C2) 
/* unsigned properties */ 
#define UCHAR MAX 255 
fidefine ULONG MAX 4294967295 
#define USHRT MAX 65535 
fendif 口 


这 些 代 码 认为 无 论 预 处 理 器 执行 什么 样 的 运算 ， 都 和 执行 环境 的 情况 相 
同 。 那 些 熟练 使 用 交叉 编译 器 的 人 知道 翻译 环境 可 能 会 和 执行 环境 有 显著 的 
不 同 。 为 了 能 使 用 这 样 的 方法 正确 地 工作 ，C 标准 需要 要 求 翻 译 器 非常 相似 
地 模仿 执行 环境 ， 并 且 那 些 共用 一 个 前 端的 翻译 器 家 族 必 须 调整 翻译 时 的 算 
法 来 适应 每 个 执行 环境 。 

X3J11 花 了 很 长 时 间 来 讨论 这 些 要 求 。 最 后 ， 我 们 认为 预 处 理 器 的 发 明 
不 是 为 了 承担 这 样 严格 的 要 求 。 固 然 ， 翻 译 器 必须 在 很 多 方面 模仿 执行 环 
境 。 例 如 ， 它 必须 在 静态 存储 空间 中 计算 常量 表达 式 ， 并 且 至 少 达 到 和 执行 
环境 一 样 大 的 取 值 范围 和 精度 。 但 是 它 也 可 以 大 量 地 定义 它 自 己 的 环境 来 实 
现 dit 预 处 理 指 令 中 的 运算 。 
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所 以 在 检测 执行 环境 的 时 候 ， 不 能 用 预 处 理 器 做 试验 。 这 时 必须 包含 
<limits.h>， 并 且 测 试 它 提供 的 宏 的 值 。 

X3J11 BS SC <limits.h> 中 的 一 个 新 的 宏 是 MB_LEN_MAX。 可 以 
使 用 它 来 为 多 字 节 字符 分 配 空间 。 我 将 在 第 13 章 中 把 这 个 宏 跟 多 字 节 函数 
结合 起 来 讨论 。 


5.4 <limits.h> 的 实现 


一 般 的 选择 


必须 为 这 个 头 文件 提供 的 唯一 的 代码 就 是 该 头 文件 本 身 。<limits be 
中 定义 的 所 有 的 宏 都 可 以 使 用 术 £ 预 处 理 指 令 测试 ， 而 且 它 们 在 实际 执行 中 
改动 的 可 能 性 不 大 。( 但 <float.h> 中 定义 的 宏 却 不 是 这 样 。) 


大 多 数 现代 计算 机 都 使 用 8 位 char 类 型 、 两 字 节 short 类 型 和 4 字 节 
long 类 型 。 

下 面 是 基于 这 种 思想 的 几 个 常用 的 变种 : 

口 int 类 型 是 2 个 或 者 4 个 字 节 。 

O char 类 型 与 signed char 和 unsigned char 类 型 的 取 值 范围 相同 。 

O 有 符号 的 值 经 常 使 用 2 的 补 码 进行 编码 ， 这 种 编码 只 有 一 种 形式 的 零 
和 一 个 没有 对 应 正 值 的 负 值 。 一 个 不 太 常 用 的 是 1 的 补 码 和 有 符号 数 
值 。 它 们 都 有 两 种 形式 的 零 ( 正 零 和 人 负 零 )， 但 没有 人 负 值 。 

O 一 个 多 字 节 字符 的 字 节 数 可 以 是 任何 比 零 大 的 值 。 


因此 ， 我 发 现 写 出 一 个 可 以 扩展 为 这 些 常 用 的 选择 的 <limits.h> 版 本 
会 很 方便 。 图 5-1 显示 了 文件 1imits.h。 它 包含 了 3.4 节 介绍 的 配置 文件 
<yvals .h>。 那 个 文件 也 为 头 文件 «£10at.h 提供 了 一 些 参数 ， 这 些 在 4.4 
节 有 描述 。 另 外 ，<yvals.h> 定义 了 以 下 的 宏 : 


O _ILONG 一 一 如 果 int 类 型 为 4 个 字 节 则 它 为 非 零 ; 

O _CSIGN 一 一 如 果 char 类 型 带 符号 则 它 为 非 零 ; 

o _C2 一 一 如 果 使 用 2 的 补 码 进行 编码 ， 则 为 1， 否则 为 0; 
O _MBMAX 一 一 单个 多 字 节 字符 的 在 最 坏 情 况 下 的 长 度 。 


E c2 的 使 用 使 一 个 很 重要 的 细节 变 得 很 模糊 。 在 使 用 2 的 补 码 的 机 器 
中 ， 不 能 简单 地 赋予 INT MIN 一 个 明显 的 值 。 例 如 ， 在 一 个 16 位 的 机 器 上 ， 
字符 序列 -32 768 被 分 解 为 两 个 符号 ， 一 个 负 号 和 一 个 值 为 32 768 的 整 型 常 
量 。 后 者 为 long 类 型 ， 因 为 它 太 大 了 而 不 能 用 in 类 型 来 表示 。 对 这 个 值 取 
负 不 会 改变 它 的 类 型 。 然 而 ，C 标准 要 求 INT MIN 的 类 型 为 int。 否 则 ， 你 就 
可 能 会 对 一 个 看 起 来 没有 错误 的 语句 出 现 的 行为 感到 惊奇 ， 例 如 : 


<limits.h> 


L 


/* test limits macros */ 
#include <limits.h> 
#include <stdio.h> 


int main() 


{ /* test basic properties of limits.h macros 

printf("CHAR BIT = %2i MB LEN MAX = %2i\n\n", 
CHAR BIT, MB LEN MAX); 

printf(" CHAR MAX = $10i CHAR MIN = $10i\n", 
CHAR MAX, CHAR MIN); 

printf(" SCHAR MAX = $10i SCHAR MIN = %10i\n", 
SCHAR MAX, SCHAR MIN): 

printf("UCHAR MAX = %10u\n\n", UCHAR MAX); 

printf(" SHRT MAX - %10i SHRT MIN = $10i\n", 
SHRT MAX, SHRT MIN); 

printf("USHRT MAX = %10u\n\n", USHRT MAX); 

printf(" INT MAX = %10i INT MIN = %10i\n", 
INT MAX, INT MIN); 

printf(" UINT MAX = %10u\n\n", UINT MAX); 

printf(" LONG MAX = $101i LONG MIN = $101i\n", 
LONG MAX, LONG MIN); 

printf ("ULONG MAX = $101uMn", ULONG MAX); 


fif CHAR BIT < 8 || CHAR MAX < 127 || 0 < CHAR MIN \ 
|| CHAR MAX != SCHAR MAX && CHAR MAX !- UCHAR MAX 
ferror bad char properties 
fendif 
*if INT MAX < 32767 || -32767 < INT MIN || INT MAX < SHRT MAX 
#error bad int properties 
Hendif 
dif LONG MAX < 2147483647 || -2147483647 < LONG MIN \ 


|| LONG MAX < INT MAX 
ferror bad long properties 
#endif 

#if MB LEN MAX < 1 

#error bad MB LEN MAX 


fendif 

#if SCHAR MAX < 127 || -127 < SCHAR MIN 
terror bad signed char properties 

Send) € 

#if SHRT MAX < 32767 || -32767 < SHRT MIN A 


|| SHRT, MAX « SCHAR MAX 

terror bad short properties 

tendif 

Hif UCHAR MAX < 255 |] UCHAR MAX / 2 < SCHAR MAX 

terror bad unsigned char properties 

#fendif | 

#if UINT MAX < 65535 || UINT MAX / 2 < INT MAX \ 
| | UINT MAX < USHRT MAX 

#error bad unsigned int properties 

fendif 

Hif ULONG MAX < 4294967295 || ULONG MAX / 2 < LONG MAX ^ 
| | ULONG MAX < UINT MAX 


*/ 
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图 5-2 #error bad unsigned long properties 
(D |#endif 
#if USHRT MAX < 65535 || USHRT MAX / 2 < SHRT MAX \ 
|| USHRT MAX < UCHAR MAX 
ferror bad unsigned short properties 


#endif 
puts("SUCCESS testing «limits.h»"); 
return(0); 
) 口 


printf("range is from $d to %d\n", INT MIN, INT MAX); 
唯一 安全 的 途径 是 使 用 一 个 形 如 〈-32 767-10. 的 表达 式 来 得 到 这 个 值 。 给 
定 对 «limits.h» 进行 参数 化 的 方式 ， 你 可 以 免费 地 学 到 这 个 窍门 。 


还 有 一 个 细节 也 不 容 忽 视 。 我 在 前 面 已 经 提 到 ， 预 处 理 的 运算 不 必 模 仿 
执行 环境 的 做 法 。 原 则 上 ， 你 可 以 在 一 个 32 位 long 类 型 的 主机 上 为 一 个 36 
位 long 类 型 的 执行 环境 编译 程序 。 然 而 ， 这 个 主机 必须 强制 获得 <limits.h> 
中 的 正确 值 。 那 就 是 说 ， 它 必须 以 至 少 36 位 long 类 型 来 执行 预 处 理 运算 。 
毕 竞 ，X3J11 为 实现 者 所 做 的 说 明 的 范围 没有 这 么 广 。 


5.5 <limits.h> 的 测试 


图 5-2 显示 了 测试 程序 tlimits.c。 它 为 提供 了 一 个 简洁 的 、 健 全 的 、 
可 以 在 <limits.h> 下 运行 的 检测 。 虽 然 并 不 是 很 详尽 ， 但 它 确 实 可 以 辨别 
这 个 头 文件 是 不 是 基本 上 健全 。 它 也 提供 了 一 个 可 读 的 摘要 ， 该 摘要 记录 了 
<limits ho 中 定义 的 宏 的 值 。 | 

注意 所 有 的 动作 都 在 翻译 时 发 生 ， 因 为 所 有 的 宏 在 HE 预 处 理 指令 下 都 
会 起 作用 。 如 果 这 个 测试 编译 通过 了 ， 它 就 一 定 可 以 运行 ， 并 打印 出 摘要 和 
成 功 执行 的 信息 ， 然 后 在 成 功 的 状态 下 退出 。 . 

下 面 是 在 一 个 兼容 PC 的 实现 下 的 输出 ， 该 实现 下 ，char 和 signed char 
的 表示 相同 。 


CHAR BIT = 8 MB LEN MAX = 8 


CHAR MAX = 127 CHAR MIN = -128 
SCHAR MAX = 127 SCHAR MIN = -128 
UCHAR MAX = 255 

SHRT MAX = 32767 SHRT MIN = -32768 
USHRT MAX = 65535 

INT MAX = 32767 INT MIN = -32768 
UINT MAX = 65535 

LONG MAX = 2147483647 LONG MIN = -2147483648 


ULONG MAX = 4294967295 
SUCCESS testing <limits.h> 
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56 参考 文献 


57 习题 


5.1 
5.2 


5.3 


5.4 


5.5 


5.6 


5.7 


4.5 节 描 述 的 程序 enquire 也 生成 了 文件 limits.h, 

IEEE Standard 1003-1987 (Piscataway, N.J.: Institute of Electrical and Electronics 
Engineers, Inc., 1985). 这 是 为 了 让 C 程序 可 以 在 UNIX 和 UNIX 可 兼容 的 操 
作 系 统 下 运行 而 制定 的 POSIX 标准 。 头 文件 <limits.h> 就 是 因此 而 产生 
的 。 


确定 你 的 翻译 器 中 描述 整数 算术 所 使 用 的 参数 。 
修改 <Iimits.h>， 使 它 适 用 于 你 使 用 的 翻译 器 。 
阅读 下 面 的 代码 ; 


int in = 1.0; 
short a[N]; 


for (i = 0; i < n; ++i) 
in *= afil; 


对 于 你 使 用 的 翻译 器 ， 在 变量 in 的 计算 结果 溢出 之 前 ，N 的 最 大 值 可 以 是 多 
D? 在 一 个 任意 的 C 翻译 器 下 呢 ? 
疯 读 下 面 的 代码 : 


long lo = 1.0; 
int a[N]; 


for (i = 0; i < n; ++i) 
lo *= ali]; 


对 于 你 使 用 的 翻译 器 ， 在 变量 10 的 计算 结果 溢出 之 前 ，K 的 最 大 值 可 以 是 多 
少 ? 在 一 个 任意 的 C 翻译 器 下 呢 ? 

一 个 标准 C 的 实现 可 以 使 sizeof (long) 等 于 一 个 字 节 吗 ? 这 样 的 实现 有 什 
么 特殊 的 属性 ? 

[ 难 ] 写 一 个 程序 ， 该 程序 仅 通 过 算术 运算 就 可 以 确定 <limits.h> 中 定义 的 
宏 的 值 。 假 设 你 不 知道 整数 表示 的 底层 实现 。 

[ 很 难 ] 修改 上 题 中 的 程序 ， 使 它 能 在 某 个 实现 下 安全 地 工作 ， 该 实现 遇 到 整 
数 溢 出 时 会 终止 程序 的 执行 。 假 设 一 旦 发 生 汶 出 ， 程 序 不 能 重新 收回 控制 权 。 


6.1 


<locale.h> 


背景 知识 


历史 


头 文件 <locale.h> 是 X3J11 C 标准 委员 会 的 一 项 发 明 。 在 C 的 早期 实 
现 中 几乎 没有 和 区 域 设置 相似 的 东西 ， 这 就 和 该 委员 会 已 宣布 的 目标 “将 已 
经 有 的 实践 制定 为 标准 ”有 些 不 一 致 了 。 然 而 ， 当 时 我 们 这 些 X3J11 委员 会 
成 员 都 认为 这 种 做 法 的 动机 是 非常 好 的 一 一 这 当然 是 自我 辩护 了 。 

这 个 特殊 的 头 文件 是 在 C 标准 制定 工作 开始 5 年 之 后 突然 出 现 的 。 当 o- 
时 ， 很 多 人 都 认为 C 标准 的 实质 性 工作 已 经 完成 了 ， 我 们 只 是 简单 地 对 该 产 
品 上 做 一 些 收尾 的 工作 。 因 为 这 个 产品 花费 了 我 们 5 年 的 时 间 ， 所 以 任何 性 
质 的 更 改 都 会 遭 到 抵抗 。 

大 约 就 是 那个 时 候 ， 我 们 发 现 很 多 欧洲 人 对 X3J11 开发 的 C 标 准 中 的 
某 些 部 分 不 是 太 满 意 ， 它 在 几 个 关键 的 地 方太 美国 化 了 。 他 们 认为 美国 人 不 
了 解 世 界 市 场 的 需求 。 因 此 ， 他 们 更 愿意 等 待 ， 希 望 在 一 个 更 合适 的 场合 斗 
争 。 因 此 ， 欧 洲 人 理所当然 地 认为 C 的 ISO 标准 应 该 和 ANSI C 标准 不 同 。 


我 们 很 多 人 都 不 同意 那 种 立场 。 我 们 认为 不 论 ANSI 开发 的 是 什么 标准 ， 
都 要 被 国际 社会 认可 。 以 前 也 有 计算 机 语言 在 世界 各 地 有 不 同 的 标准 ， 我 们 
已 经 看 到 了 它们 的 下 场 。 我 们 感觉 到 ， 如 果 C 的 最 终 版 本 来 自 男 一 个 委员 
会 ， 而 且 他 们 只 是 参考 我 们 的 成 果 ， 那 么 我 们 5 年 的 努力 就 成 了 泡影 。 


所 以 我 们 让 欧洲 人 列 出 了 他 们 想 要 修改 的 内 容 ， 这 些 条 目 中 的 大 部 分 都 
是 关于 让 C 程序 能 适应 不 同文 化 的 处 理 方式 。 对 于 那些 有 很 多 语言 和 国家 
共存 的 大 陆 《〈 例 如 欧洲 ) 来 说 ， 这 个 问题 很 突出 。 美 国人 习惯 了 单一 的 语言 
(即使 不 是 官方 的 ， 也 被 广泛 使 用 ) 和 一 个 相当 简单 的 字母 表 。 


AT&T Bell 实验 室 竟然 专门 召开 了 一 个 特殊 的 会 议 来 讨论 国际 化 〈 这 是 
一 个 很 长 的 词 ， 现 在 人 们 越 来 越 频繁 地 讨论 它 。 似 乎 它 没有 短 一 点 的 同义词 
来 代替 。 非 正式 的 解决 方法 是 引入 118N，18 代表 省 略 的 字母 的 个 数 ) 的 各 
种 问题 。 该 会 议 提出 了 向 C 标准 中 加 入 区 域 设 置 支持 的 建议 。 最 后 被 人 们 所 
接受 的 机 制 和 最 原始 的 提议 相当 接近 。 
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<locale.h> 


环境 


函数 getenv 


把 区 域 设 置 加 到 C 中 取得 了 预期 的 效果 。 很 多 反对 把 ANSI C 标准 作为 
国际 标准 的 声音 都 不 见 了 。 据 我 估计 ， 解 决 区 域 设置 问题 又 花费 了 X3J11 一 
年 的 时 间 。 并 且 我 们 可 能 又 花费 了 一 年 的 时 间 来 处 理 来 自 国 际 社会 的 剩余 问 
题 。(WG14 一 一 ISO C 标准 委员 会 ， 现 在 仍然 在 做 着 完善 现存 的 C 标准 的 工 
作 )。 然 而 ， 我 们 成 功 地 完成 了 一 个 C 标准 ， 这 个 标准 的 ANSI 版 本 和 ISO 
版 本 目前 是 相同 的 。 


编写 适应 性 强 的 代码 并 不 完全 是 一 个 新 的 话题 ， 早 期 的 形式 大 约 15 年 
前 就 在 UNIX 操作 系统 上 出 现 了 。 人 们 想 出 了 一 种 方法 ， 就 是 为 某 些 产生 新 
进程 的 系统 调用 添加 环境 变量 。( 这 种 服务 在 UNIX 领域 被 称 为 exec， 或 者 
它 的 变化 形式 。) 环境 变量 是 一 个 无 限 的 名 字 集 合 ， 每 一 个 名 字 都 确定 一 个 
以 空 字 符 结 尾 的 字符 串 值 。 我 们 可 以 在 一 个 进程 中 添加 、 修 改 或 者 删除 环境 
变量 。 如 果 一 个 进程 引发 了 另 一 个 新 进程 ， 环 境 变量 就 会 被 自动 复制 到 新 进 
程 的 上 映 象 中 。 


新 进程 可 以 忽略 环境 变量 ， 但 这 样 它 会 丢失 几 十 或 者 几 百 个 字 节 的 存储 
空间 。 或 者 它 也 可 以 找到 某 些 环境 变量 并 访问 它们 的 当前 值 。 一 个 常见 的 变 
量 是 "T2"， 它 可 以 为 库 的 日 期 函数 提供 关于 当前 时 区 的 信息 。 如 果 "Tz" 的 
值 是 EST05EDT， 时 间 也 数 就 会 把 当地 的 标准 时 间 标 为 EST， 把 当地 的 夏令 时 
标 为 EpT。 当 地 标准 时 区 比 UTC 一 一 也 就 是 过 去 所 说 的 格林 尼 治 平时 一 一 早 
5 个 小 时 。 


环境 变量 有 很 多 种 用 途 。 它 们 是 将 文件 名 隐 式 地 添加 到 应 用 程序 中 的 一 
种 好 方法 ， 内 为 把 文件 名 和 程序 直接 捆绑 在 一 起 有 很 多 弊端 。 如 果 不 考 虑 那 
些 用 户 不 需要 知道 的 隐藏 的 文件 名 ， 提 示 用 户 输入 文件 名 也 可 以 说 是 -一 种 很 
好 的 方法 。 在 命令 行 中 提示 输入 文件 名 来 启动 一 个 程序 也 很 实用 ， 不 过 它 可 
能 过 于 繁琐 。 如 果 几 个 程序 需要 访问 一 个 相同 的 文件 名 ， 就 更 加 复杂 了 。 相 
比 之 下 ， 下 面 介绍 的 方法 就 更 加 简便 。 为 该 文件 名 设置 一 个 环境 变量 ， 并 将 
其 放 在 一 个 启动 会 话 的 脚本 中 。 虽 然 文 件 名 被 存放 在 了 一 个 地 方 ， 但 是 它 在 
整套 程序 中 都 可 以 被 使 用 。 


微软 的 MS-DOS 也 支持 环境 变量 一 一 这 是 借鉴 UNIX 的 方法 之 一 。 有 些 
商业 软件 包 也 把 使 用 环境 变量 作为 一 种 优势 。 环 境 变 量 最 常见 的 一 个 作用 是 
查找 目录 ， 这 里 的 目录 是 指 包含 支持 文件 的 特殊 路 径 或 者 适合 存储 临时 文件 
的 路 径 。 当 然 它 们 也 有 很 多 其 他 的 用 途 。 

C år EAS Y AH getenv, RAE <stdlib.h> 中 声明 。 以 一 
个 环境 变量 为 参数 调用 getenv， 假 如 环境 变量 的 值 存 在 ， 它 就 会 返回 一 个 
指向 这 个 环境 变量 的 值 串 的 指针 。 引 用 一 个 没有 定义 的 环境 变量 也 不 会 引 
起 错误 。 


函数 putenv 


为 什么 引入 
区 域 设置 


类 别 
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然而 ，C 标准 库 并 没有 包含 和 getenv 相对 应 的 函数 putenv。putenv 
可 以 修改 和 环境 变量 相关 联 的 值 。 如 果 只 是 简单 的 输入 ，X3J11 不 知道 怎样 
描述 putenv 的 含义 。 各 种 单 用 户 多 进程 系统 中 的 putenv 各 不 相同 。 所 以 
可 以 为 读 取 环境 变量 写 出 可 移植 的 代码 ， 但 不 能 定义 一 种 标准 的 方式 来 修改 
它们 。 


区 域 设置 可 以 提供 哪些 环境 变量 不 能 提供 的 东西 ? 一 个 词 : 结构 。 这 是 
一 个 面向 对 象 的 时 代 ， 所 以 ， 可 以 把 区 域 设 置 看 成 面向 对 象 的 环境 变量 。 一 
个 区 域 设 置 可 以 提供 很 多 相 联系 的 参数 的 信息 。 这 些 值 对 一 个 具体 的 文化 来 
说 是 一 致 的 。 要 传递 同样 数量 的 信息 ， 必 须 为 环境 变量 在 命名 空间 中 保留 很 
多 的 名 字 ， 而 且 还 要 为 信息 子 集 修改 的 不 一 致 性 承担 风险 。 


顺便 说 一 下 ， 当 我 提 及 一 种 文化 时 ， 我 并 不 仅仅 是 说 使 用 同一 种 语言 
的 团体 。 美 国人 书写 日 期 为 7/4/1776 (独立 日 )， 同 样 的 日 期 在 英国 被 写 为 
4/7/1776 (感恩 节 )。 甚 至 在 美国 国内 ， 人 们 的 习惯 也 不 同 。 例 如 一 般 人 可 能 
把 一 个 借款 记 为 $-123.45， 而 会 计 可 能 更 喜欢 ($123.45). 


由 于 这 种 原因 和 其 他 一 些 原因 ， 区 域 设置 就 有 了 子 结构 。 可 以 设置 整个 
区 域 ， 也 可 以 修改 一 个 或 者 多 个 类 别 。 头 文件 <locale.h> 定义 了 一 些 宏 ， 
这 些 宏 具 有 像 LC COLLATE fü LC TIME 这 样 的 名 字 。 每 一 个 宏 都 可 以 扩展 为 
一 个 整数 值 ， 你 可 以 把 这 个 整数 值 作为 修改 区 域 设 置 的 函数 setlocale 的 类 
别 参数 。 存 在 以 下 几 个 独立 的 类 别 ; 


控制 整理 顺序 (LC COLLATE); 
字符 分 类 (LC CTYPE); 

货币 格式 (LC_MONETARY); 

其 他 的 数字 格式 (LC_NUMERIC); 


时 间 (LC_TIME)。 


一 个 实现 也 可 以 选择 提供 附加 的 类 别 。 当 然 ， 使 用 了 附加 类 别 的 程序 ， 
其 可 移植 性 就 会 有 所 下 降 。 


隐藏 在 类 别 背 后 的 思想 是 应 用 程序 可 能 希望 对 它 的 区 域 设 置 做 某 些 
小 的 变动 。 它 可 能 想 用 当地 的 语言 打印 日 期 ， 同 时 使 用 这 种 语言 规定 的 格 
式 。 它 也 可 能 选择 使 用 点 作为 十 进 制 的 小 数 点 ， 即 使 当地 的 习惯 做 法 是 使 
用 有 逗号。 或 者 应 用 程序 可 能 会 先 完全 适应 一 个 具体 的 区 域 设 置 ， 然 后 改变 
LC MONETARY 类 别 ， 以 适应 全 球 性 的 企业 财务 信息 处 理 标准 。 
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6.2 C 标准 的 内 容 
«locale. bai 7.4 区 域 设 置 «1ocale. h> 
头 文件 <locale.h> 声明 了 两 个 函数 和 一 种 类 型 ， 并 定义 了 一 些 宏 。 
声明 的 类 型 是 ， 


struct lconv struct lconv 


它 包 含 的 成 员 和 数字 值 的 格式 有 关 。 这 个 结构 至 少 应 包含 以 下 的 成 员 ， 不 分 先后 顺序 。 这 
些 成 员 的 语义 和 它们 的 取 值 范围 在 7.4.2.1 中 有 说 明 。 在 “c" 区 域 设置 中 ， 这 些 成 员 的 值 在 


下 面 的 注释 部 分 有 指定 。 
char *decimal point; få n.n xf 
char *thousands sep; få un RY, 
char "grouping; få "" xj 
char *int_curr_symbol; [å un ey 
char *currency symbol; få pn xy 
char *mon decimal point; ZS nn zi 
char *mon thousands sep; få un */ 
char *mon grouping; få vn xf 
char *positive sign; [å vn wy 
char *negative sign; [* vn */ 
char int frac digits; /* CHAR MAX */ 
char frac digits; /* CHAR MAX */ 
char p cs precedes; /* CHAR MAX */ 
char p sep by space; /* CHAR MAX */ 
char n cs precedes; /* CHAR MAX */ 
char n sep by space; /* CHAR MAX */ 
char p sign posn; M CHAR_MAX */ 
char n_sign_posn CHAR_MAX */ 
NULL 定义 的 宏 有 NULL (7.1.6 中 有 说 明 ) AFERE, 
LC ALL LC_ALL 
LC COLLATE LC_COLLATE 
LC_CTYPE LC_CTYPE 
LC_MONETARY LC_MONETARY 
LC NUMERIC LC NUMERIC 
LC TIME 


这 些 宕 展开 为 整数 常量 表达 式 ， 它 们 的 值 各 不 相同 ， 可 以 作为 setlocale 函数 的 第 一 个 参 
数 使 用 。 以 IC_ 和 一 个 大 写字 母 开 头 的 其 他 宏 也 可 以 由 实现 指定 ”。 


7.4.1 区 域 设 置 控 制 
setlocale | 7.4.1.1 函数 setlocale 


概述 


#include <locale.h> 
char *setlocale(int category, const char *locale); 


说 明 

函数 setlocale 按照 参数 category 和 locale 选择 适合 程序 的 区 域 设置 的 各 个 类 别 。 
函数 setlocale 可 能 被 用 来 修改 和 查询 程序 当前 的 整个 区 域 设 置 或 者 其 中 的 一 部 分 。 参 
数 category 的 值 为 iC_ALL， 对 程序 的 整个 区 域 设 置 进行 命名 ， 而 其 他 的 值 只 对 程序 区 
域 设置 的 一 部 分 进行 命名 。 类 别 LC COLLATE 影响 函数 strcoll 和 strxfrm 的 行为 ， 类 
别 IC_cryPE 影 响 字 符 处 理 函 数 " 和 多 字 节 函数 的 行为 ， 类 别 LC. MONETARY 影响 函数 
localeconv 返回 的 货币 格式 信息 ;类 别 LC NUMERIC 影响 格式 化 输入 输出 函数 和 字符 转换 
函数 的 小 数 点 字符 ， 以 及 函数 localeconv 返回 的 货币 格式 信息 ; 类 别 nc TIME 影响 函数 
strftime 的 行为 。 

参数 locale 的 值 "C" 为 C 翻译 器 指定 了 最 小 的 环境 值 "" 指定 了 实现 定义 的 本 地 环 
境 。 其 他 实现 定义 的 串 可 能 作为 setlocale 的 第 二 个 参数 传递 。 
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localeconv 


在 程序 启动 时 ， 执 行 下 面 的 代码 或 者 和 它 等 价 的 代码 ; 
setlocale(LC ALL, "C"); 

SEHR A TOR ABE HE PAGE pA setlocale 的 情况 相同 。 

返回 值 

如 果 参 数 locale 是 一 个 指向 串 的 指针 且 选 择 有 效 ， 则 清 数 setlocale 返回 一 个 
和 新 的 区 域 设 置 指定 的 category 相 联 系 的 串 的 指针 。 如 果 选 择 因 故 无 法 实现 ， 则 函数 
setlocale 返回 一 个 空 指针 且 程 序 的 区 域 设置 不 改变 。 

如 果 参 数 locale 是 一 个 空 指针 ， 则 函数 setlocale 返回 一 个 和 程序 当前 区 域 设置 的 
category 相关 的 串 的 指针 ， 程 序 的 区 域 设 置 不 改变 “。 

函数 setlocale 返回 的 指 血 串 的 指针 要 满足 对 那个 串 值 和 它 的 相关 的 类 别 的 后 继 
调用 会 恢复 程序 区 域 设置 的 相应 的 部 分 。 指 向 的 串 不 能 被 程序 修改 ， 但 可 能 会 被 涌 数 
setlocale 的 下 一 次 调用 覆盖 。 

参见 : 格式 化 输入 输出 肾 数 (7.9.6)、 多 字 节 字符 函数 (7.10.7)、 多 字 节 字符 串 
函数 (7.10.8)、 字 符 串 转换 函数 (7.10.1). strcoll 函数 (7.11.4.3)、strftime 函数 
(7.12.3.5), strxfrm 函数 (7.11.4.5). 


7.4.2 数字 格式 习惯 查询 
7.4.2.1 函数 localeconv 
概述 


#include <locale.h> 
struct lconv *localeconv(void); 


说 明 
函数 localeconv 根据 当前 区 域 设 置 的 规则 ， 对 一 个 struct lconv 类 型 的 对 象 的 成 员 
进行 赋值 ， 使 其 值 适合 格式 化 数字 量 〈 货 币 等 )。 
结构 中 char* 类 型 的 成 员 是 指向 字符 串 的 指针 ， 它 们 中 的 任何 一 个 都 《除了 
decimal point) 可 以 指向 ""， 以 说 明 该 值 在 当前 区 域 设置 下 不 可 用 或 者 长 度 为 零 。char 
类 型 的 成 员 是 非 负 数字 ， 任 一 成 员 都 可 以 是 CHAR_MAX， 以 说 明 该 值 在 当前 区 域 设置 下 不 可 
用 。 这 些 成 员 有 : 
char *decimal point 
用 来 格式 化 非 货币 量 的 小 数 点 字符 。 
char *thousands sep 
用 来 对 格式 化 的 非 货币 量 中 小 数 点 前 面 的 数字 进行 分 组 的 字符 。 
char *grouping 
一 个 字符 串 ， 它 的 元 素 说 明了 格式 化 的 非 货币 量 中 每 一 组 数字 的 数目 。 
char *int curr symbol 
适合 当前 区 域 设置 的 国际 货币 符号 。 前 3 个 字符 包含 了 符合 ISO 4217:1987 标准 的 字母 国 
际 货币 符号 。 第 四 个 字符 《后面 紧 跟 空 字符 ) 是 国际 货币 符号 与 货币 量 之 间 的 分 隔 符 。 
char *currency symbol 
适用 于 当前 区 域 设 置 的 当地 流通 符号 。 
char *mon decimal point 
用 来 格式 化 货币 量 的 小 数 点 。 
char *mon thousands sep 
对 格式 化 的 货币 量 中 小 数 点 前 面 的 数字 进行 分 组 的 分 隔 符 。 
char *mon grouping 
一 个 字符 串 ， 它 的 元 素 说 明了 格式 化 的 货币 量 分 组 中 每 组 数字 的 数目 。 
char *positive sign 


用 来 说 明 一 个 非 负 的 格式 化 货币 量 的 字符 串 。 


<locale.h> 


char *negative sign 

FDR GUAT RLE EAR. 
char int frac digits 

在 一 个 国际 标准 格式 化 货币 量 中 显示 的 小 数 数字 〈 小 数 点 后 面 的 数字 ) 的 数目 。 
char frac digits 


在 一 个 格式 化 货币 量 中 显示 的 小 数 数字 (小 数 点 后 面 的 数字 ) 的 数目 。 


char p cs precedes 
4 currency symbol 放 在 一 个 非 负 的 格式 化 货币 量 的 值 的 前 面 或 者 后 面 时 ， 分 别 设 为 
1 或 者 0。 


char p sep by space 


currency symbol 与 非 负 的 格式 化 货币 量 的 值 用 空格 分 开 时 为 1， 否 则 为 0。 


char n cs precedes 

currency symbol 放 在 一 个 负 的 格式 化 货币 量 的 前 面 或 者 后 面 时 ， 分 别 设 为 1 或 者 0。 
char n sep by space 

currency symbol 与 负 的 格式 化 货币 量 用 空格 分 开 时 为 1， 否 则 为 0。 
char p sign posn 

它 的 值 用 来 说 明 一 个 非 负 的 格式 化 货币 量 中 positive sign 的 位 置 。 


char n sign posn 


它 的 值 用 来 说 明 一 个 负 的 格式 化 货币 量 中 negative sign 的 位 置 。 
grouping 和 mon grouping 的 元 素 的 解释 如 下 : 
CHAR_MAX 不 能 进一步 分 组 ; 


0 剩余 的 数字 重复 使 用 前 一 个 元 素 ; 
其 他 值 ” 整 数值 是 组 成 当前 组 的 数字 的 数目 。 检 查 下 一 个 元 素来 确定 当前 分 组 前 面 的 
下 一 组 数字 的 数目 。 


Sign, posn 和 n_sign_posn 的 值 解 释 如 下 ， 

0 数字 与 currency symbol 放 在 括号 中 ; 

1 符号 字符 串 放 在 数字 与 currency_symbol 前 面 ; 

2 符号 字符 串 放 在 数字 与 currency symbol 后 面 ; 

3 符号 字符 串 紧 挨 着 放 在 currency symbol 前 面 ; 

4 SETS BRB RCE currency symbol 后 面 。 

实现 的 行为 应 假设 没有 库 函 数 调 用 localeconv, 

返回 值 

pk Å Localeconv 返回 一 个 指向 已 填充 对 象 的 指针 。 返回 值 指向 的 结构 不 能 被 程序 修 
改 ， 但 是 可 能 会 被 localeconv 的 下 一 次 调用 覆盖 。 另 外 ， 用 类 别 LC ALL, LC MONETARY 
或 者 LC_NUMERIC 调用 函数 setlocale 可 能 会 覆盖 结构 的 内 容 。 


例子 

下 面 的 表 举 例 说 明了 可 能 会 被 四 个 国家 用 来 格式 化 货币 量 的 规则 ; 

国家 正 格式 负 格式 国际 格式 
意大利 L.1.234 -L.1.234 ITL.1.234 
荷兰 F 1.234,56 F -1.234,56 NLG 1.234,56 
挪威 kr1.234,56 kr1.234,56- NOK 1.234,56 
瑞士 SFrs.1,234.56 SPrs.1,234.56C CHF 1,234.56 


对 这 4 个 国家 ，1ocaleconv 返回 的 结构 的 货币 成 员 的 值 分 别 是 : 
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意大利 荷兰 挪威 瑞士 
int curr symbol "ITL." "NLG" "NOK" "CHF" 
currency symbol "L." "Er "kr" "SFrs." 
mon decimal point ^ "on "t 
mon thousands sep . . uu "Vut 
mon grouping "\3" "\3" "A3 "A3 
positive sign " " 
negative_sign WË nae WË "C" 
int frac digits 
frac digits 
p. cs, precedes 
p.sep by space 
n cs, precedes 
n sep by space 
p. sign posn 
n sign posn 


脚注 

100. 参考 “ 库 的 展望 ”(7.13.3)。 

101. 7.3 中 行为 不 受 当前 区 域 设置 影响 的 仅 有 的 两 个 函数 是 isdigit 和 isxdigit. 

102. 当 category 的 值 为 LC_ALL 时 ， 对 一 个 异 构 的 区 域 设 置 ， 实 现 必须 安排 在 一 个 串 
中 对 各 个 类 别 编码 。 


6.3 <locale.h> 的 使 用 


区 域 设 置 中 提供 的 很 多 信息 都 纯粹 是 信息 性 质 的 。 例 如 C 从 来 都 不 会 把 
货币 值 当 作 一 个 特殊 的 日 期 类 型 来 处 理 ， 所 以 当 类 别 LC. MONETARY 改变 时 ， 
其 他 的 c 标准 库 函 数 都 不 会 受到 影响 。 但 另 一 方面 ， 区 域 设置 的 某 些 变 化 肯 
定 会 影响 到 某 些 库 函数 的 行为 。 如 果 一 种 文化 使 用 逗号 作为 一 个 十 进 制 数 小 数 
点 ， 那 么 扫描 函数 就 应 该 能 够 接受 逗号 ， 而 打印 函数 应 该 把 各 号 放 在 适当 的 位 
置 ， 这 就 是 实际 情况 。 下 面 是 所 有 的 随 着 区 域 设置 的 改变 而 变化 的 库 行 为 。 


库 的 变化 o 当 类 别 LC_COLLATE 改变 时 ，<string.h> 中 声明 的 函数 strcoll 和 
strxfrm 会 改变 它们 比较 的 方式 。 

C) 当 类 别 LO CTYPE 改变 时 ，<ctype.h> h HAJRA, <stdio.h> 中 
声明 的 打印 和 扫描 函数 和 «stalib.n» 中 声明 的 数字 转换 函数 会 改变 
它们 测试 和 修改 某 些 字符 的 方式 。 

O 当 类 别 LC CTYPE oy 4E AY, <stdlib.h> HA FE B] MSF Å ASA 
<stdio.h> 中 声明 的 打印 和 扫描 函数 会 改变 它们 解析 和 转换 多 字 节 串 
的 方式 。 

O 当 类 别 LCNUMERIC 改变 时 ，<stdio.h> 中 声明 的 打印 和 扫描 函数 与 
«stdlib.h» 中 声明 的 stof 和 strtod 会 改变 它们 对 十 进 制 小 数 点 字 
符 的 使 用 方式 。 

C) 当 类 别 LC. TIME 改变 时 ，<time.h> 中 声明 的 函数 strftime 会 改变 
它 把 时 间 转 换 为 字符 串 的 方式 。 

C) 当 类 别 LC MONETARY 或 者 LC NUMERIC 改变 时 ，<locale.h> 中 声明 
的 函数 Localeconv 会 改变 它 的 返回 值 。 
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<locale.h> 


"c" 区 域 设置 


本 地 区 域 设置 


区 域 设置 的 
恢复 


这 么 多 的 变化 还 是 很 可 怕 的 。 如 果 很 多 C 标准 库 都 会 改变 它 的 行为 ， 那 
么 怎么 能 写 出 可 移植 的 代码 呢 ? 能 把 你 的 代码 放 到 德国 使 用 吗 ? 当 它 在 那里 
运行 的 时 候 isalpha 将 会 做 些 什么 呢 ? 如 果 把 你 的 代码 和 另 一 个 源 程序 的 函 
数 混 合 起 来 ， 它 们 能 制造 多 少 麻 烦 ? 函数 每 一 次 得 到 控制 权 的 时 候 ， 都 有 可 
能 在 不 同 的 区 域 设置 下 运行 。 代 码 要 怎样 适应 这 些 情况 ? 


当 我 们 详细 地 描述 了 区 域 设 置 之 后 ，X3J11 对 这 些 问题 很 苦恼 。 我 们 认 
识 到 很 多 人 根本 就 不 关心 这 种 机 制 ， 因 为 添加 区 域 设 置 可 能 对 那些 人 影响 不 
太 大 。 还 有 一 些 人 想 完成 某 些 适 度 的 目标 ， 他 们 想 让 和 美国 文化 联系 在 一 起 
的 旧 的 C 习惯 跟 他 们 的 文化 一 致 。 还 有 一 些 人 的 目标 很 高 ， 他 们 希望 写 出 的 
程序 不 经 过 修改 ， 就 可 以 以 目标 模块 或 者 可 执行 程序 的 形式 在 众多 市 场 上 出 
售 。 这 些 代码 中 关于 改变 区 域 设 置 的 部 分 一 定 会 很 复杂 。 


使 用 区 域 设置 最 简单 的 方法 就 是 不 去 管 它们 。 每 一 个 标准 C 程序 都 是 在 
"C" 区 域 设置 下 启动 。 在 这 个 区 域 设置 中 ， 传 统 的 库 函 数 行为 和 它们 一 般 的 
行为 相同 。 例 如 ，islower 只 对 英语 字母 表 中 的 26 个 小 写字 母 返回 非 零 值 ， 
小 数 点 是 一 个 点 。 如 果 你 的 程序 从 没有 调用 过 setlocale， 这 种 行为 就 不 会 
改变 。 

另 一 种 使 用 区 域 设置 最 简单 的 方法 是 只 在 程序 启动 之 后 改变 一 次 区 域 设 
置 ， 然 后 保持 不 变 。C 标准 对 "Cc" 之 外 的 区 域 设置 的 名 字 没 有 任何 要 求 。 但 
是 它 确实 定义 了 由 空 字符 串 "" 指定 的 本 地 区 域 设置 。 如 果 你 的 程序 执行 : 


setlocale (LC, ALL,"") 


它 就 转移 到 本 地 区 域 设置 。 大 概 每 一 个 实现 都 会 设计 一 种 方法 来 确定 一 个 能 
使 当地 用 户 满意 的 本 地 区 域 设置 。( 当然 ， 一 个 不 在 乎 区 域 设置 的 实现 会 让 
本 地 区 域 设置 和 "c" 区 域 设置 相同 。) 


一 旦 区 域 设置 可 以 改变 ， 在 使 用 库 函数 的 时 候 就 一 定 要 更 加 小 心 。 某 些 

东西 会 变 得 简单 ， 例 如 显示 格式 正确 的 日 期 或 者 选择 正确 的 空白 字符 ， 但 其 

他 的 就 不 那么 确定 了 ， 例 如 使 用 <ctype.h> 中 声明 的 函数 分 析 字 符 串 。 必 要 

时 ， 可 以 把 部 分 或 者 全 部 区 域 设置 恢复 为 "Cc" 区 域 设置 。 开 始 可 以 写 ; 
finclude <stalib hs 


#include <string.h> 


char *ls 


= setlocale(LC CTYPE, "C"); 
char *ss = ls ? malloc(strlen(ls) + 1) : NULL; 
if (ss) 


strcpy (ss, ls) ; 
现在 就 可 以 放心 地 在 "c" 区 域 设置 下 使 用 <ctype.h> 中 声明 的 函数 了 。 
完成 的 时 候 ， 可 以 通过 下 面 的 代码 恢复 原来 的 区 域 设置 : 
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格式 化 值 


setlocale(LC CTYPE, ss); 
free(ss); 


注意 ， 这 些 代 码 在 堆 用 完 上 且 malloc 分 配 空间 失败 的 时 候 不 能 起 作用 ， 
它 只 是 简单 地 避免 不 明智 地 使 用 任何 空 指针 。 如 果 能 保证 对 setlocale 的 
其 他 调用 不 会 在 上 面 的 两 段 代 码 之 间 起 作用 ， 就 可 以 不 用 对 分 配 空 间 和 复制 
setlocale 的 返回 的 区 域 设 置 串 进 行 处 理 。 


有 两 个 区 域 设 置 类 别 说 明了 如 何 对 值 进行 格式 化 以 和 当地 的 习惯 相 匹配 。 


D LC MONETARY 类 别 说 明 怎样 格式 化 货币 量 ， 既 能 符合 当地 习惯 ， 又 和 
国际 标准 (ISO 4217) 一 致 。 

D LCNUMERIC 规定 了 C 标准 库 使 用 的 小 数 点 符号 ， 也 说 明了 怎样 格式 
化 非 货 币 量 。 


例如 ， 这 里 给 出 了 依照 当地 习惯 对 货币 量 $-3.00 格式 化 的 各 种 方式 ， 它 
们 由 存储 在 struct lconv 中 的 3 个 成 员 的 值 决 定 : 


n sep by space: 0 


n sign posn: 0 1 2 3 4 
n cs precedes:0 (3.00$) -3.00$ 3.00$- 3.00-$ 3.00$- 
1 ($3.00) -$3.00 $3.00- -$3.00 $-3.00 


n sep by space: 1 


n sign posn: 0 1 2 3 4 
n, cs precedes:0 (3.00$) -3.00$ 3.00$- 3.00-$ 3.00$- 
1 ($3.00) -$3.00 $3.00- -$3.00 $-3.00 


这 个 例子 假设 结构 成 员 currency symbol 指向 "$", mon decimal. 
point 指向 ".", negative signjÉ[u] "-", JfH frac digits 的 值 为 2。 这 
个 例子 不 能 说 明成 员 mon grouping 和 mon thousands sep 的 影响 ， 这 两 个 
成 员 描述 了 对 小 数 点 左边 的 数 进 行 分 组 和 分 离 的 方法 。 

有 3 个 附加 的 成 员 来 描述 怎样 格式 化 正 的 货币 量 。 它 们 是 P_sep_by 
space, p sign posn 和 p_cs_precedes。 对 于 国际 货币 量 ， 成 员 int curr 
symbol 决定 了 货币 符号 《而 不 是 currency symbol), int frat digits ® 
定 了 显示 多 少 位 (而 不 是 frac_qigits)。 如 果 要 格式 化 非 货币 量 ， 就 应 该 使 
用 成 员 decimal point, grouping Å] thousands sep. 


要 了 解 的 东西 实在 是 太 多 了 。 也 许 你 可 以 在 整个 应 用 程序 的 始终 都 使 用 
这 个 信息 ， 但 也 可 能 不 行 。 各 部 分 在 细节 方面 不 是 很 清楚 ， 我 们 真正 需要 的 
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函数 Fmtval 


是 一 种 格式 化 数值 数据 的 方式 ， 利 用 这 种 方式 可 以 在 一 个 地 方 应 用 所 有 相关 
信息 。 不幸 的 是 ，C 标准 并 没有 定义 这 样 的 函数 。 

我 决定 自己 定义 这 个 缺失 的 函数 。 在 经 历 了 几 次 失败 之 后 ， 最 后 我 终于 
可 以 作 以 下 声明 了 : 

char. * Fmtval(char *buf,double val, int frac digs): 
调用 者 提供 字符 缓冲 区 but 来 存放 格式 化 信息 的 值 。 《现代 的 发 展 趋势 是 规 
定 缓冲 区 的 最 大 长 度 。 如 果 没 有 这 样 的 限制 检查 的 话 ， 这 个 函数 会 变 得 相当 
BR.) 为 了 简便 一 点 ， 这 个 函数 返回 but 的 值 ， 然 后 它 把 格式 化 的 值 作 为 


一 个 以 空 字符 结束 的 串 存储 起 来 。 


还 要 把 待 格式 化 的 值 val EN double 类 型 ， 这 是 为 小 数 部 分 服务 的 ， 
使 它 至 少 具 有 16 位 的 精度 。 对 于 一 个 非 货 币 的 值 ，frac_digits HETE 
含 在 格式 化 值 中 的 小 数 部 分 的 位 数 ，struct lconv 的 成 员 对 这 个 参数 没有 


这 就 是 这 个 设计 的 精巧 之 处 (也 许 太 精 巧 了 )。 区 域 设置 信息 表明 了 值 
的 4 种 不 同 格式 : 


O 国际 货币 量 ; 

口 本 地 货币 量 ; 

口 没有 小 数 点 或 者 小 数 部 分 的 货币 量 ; 
口 有 小 数 点 和 小 数 部 分 的 货币 量 。 


只 有 在 第 四 种 情况 下 才 需 要 提供 一 个 代表 小 数 部 分 的 位 数 的 ( 非 负 ) 
值 。 这 就 意味 着 在 其 他 的 情况 下 可 以 不 去 理会 参数 frac digits 的 各 种 不 同 
的 负 值 。 


图 6-1 显示 了 文件 xftmtval.c， 这 个 文件 定义 了 郴 数 _Fmtval。 它 通过 
检查 frac digits 的 值 来 区 分 这 四 种 不 同 的 格式 : 


O få -2 CX FN INT CUR) 告诉 函数 格式 化 一 个 国际 货币 量 。 

C få -1 CE FN LCL CUR). 告诉 函数 格式 化 一 个 区 域 货币 量 。 

DO 其 他 所 有 的 值 都 是 告诉 函数 格式 化 一 个 非 货币 量 。 然 而 ， 对 一 个 包含 
小 数 点 和 小 数 部 分 的 函数 来 说 ， 小 数 部 分 的 位 数 ， 无 论 多 么 确定 必须 
是 一 个 不 等 于 CHAR MAX («limits.h» 中 定义 ) 的 非 负 值 。 所 以 ， 如 
果 使 用 CHAR MAX 的 值 或 者 其 他 不 等 于 -1 或 者 -2 的 负 值 调用 函数 
_Emtval， 就 相当 于 告诉 函数 格式 化 一 个 不 含 小 数 点 或 者 小 数 部 分 的 
非 货币 量 。 

CO 其 余 的 任何 一 个 不 等 于 CHAR MAX 的 非 负 值 告诉 函数 格式 化 一 个 含 小 
数 点 和 小 数 部 分 的 非 货 币 量 ， 且 这 个 值 指 定 了 小 数 部 分 数字 的 数目 。 
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图 6-1 


xfmtval.c 


/* Fmtval function */ 
finclude <limits.h> 
#include <locale.h> 
#include <stdio.h> 
#include <string.h> 


/* macros */ 
#define FN_INT_CUR -2 
#define FN_LCL_CUR -1 


char *_Fmtval(char *buf, double d, int fdarg) 
{ /* format number by locale-specific rules */ 
char *cur_sym, dec_pt, *grps, grp_sep, *sign; 
const char *fmt; 
int fd, neg; 


struct lconv *p = localeconv(); 
if (0 <= d) 
neg = 0; 
else 
d = -d, neg = 1; 
if (fdarg == FN INT. CUR) 
{ /* get international currency parameters 


cur_sym = p->int curr symbol; 

dec pt = p->mon decimal point [0]; 

fmt = "$-V"; 

fd = p->int_frac_digits; 

grps = p->mon grouping; 

grp sep = p->mon thousands sep[0]; 

sign = neg ? p->negative sign : p-»positive sigan; 


) 


else if (fdarg == FN LCL CUR) 
H /* get local currency parameters */ 
Static const char *ftab[21[2115] = ( 
(("(V$)", "-V$", "V$-", "V-$", "V$-"), 
("($V)", "-SV", "SV-", "-$V", "$-V"])], 
(ET (V ein, "-V 8", "V $-*, "V- $", "V$-"), 
("($ V)", "-S v", "$ v-", "-$ V", "$ -V"}}}; 


Cur, Sym = p->currency symbol; 
dec pt = p-»mon decimal point[0]; 


if (neg) 
fmt - ftab[p->n sep by space == 1] 
[p->n. cs precedes == l][p-»n sign posn < 0 
|| 4 < p-»n sign posn ? 0 : p-»n sign posn]; 
else 
fmt - ftab[p->p sep by space == 1] 


[p->p cs, precedes == 1]Íp-»p sign posn «0 
|| 4 < p-»p sign posn ? 0 : p->p sign posn]: 
fd = p-»frac digits; 
grps - p-»mon grouping: 
grp sep = p-»mon thousands sep[0]; 
sign - neg ? p->negative sign : p-»positive sign; 


) 


{ 


char *end, *s; 
const char *g; 
size t i, ns; 


/* get numeric parameters(cur sym not used) 
dec, pt = p->decimal point[0]: 
fmt = "-V"; 

fd - fdarg; 

grps = p->grouping; 

grp sep = p->thousands_sep[0]; 
sign= neg ? "-":""; 

) 


/* build string in buf under control of fmt */ 


for 


) 


) 


break; 

case '-': /* insert sign string */ 
strcpy(s, sign); 
break; 

default: /* insert literal format char */ 

Sait = *fmt, *s = 'NO'; 

break; 

case'V': /* insert formatted value */ 


return (buf); 


(s = buf; *fmt; ++fmt, s += strlen(s)) 
switch (*fmt) 
{ /* process a format char */ 
case '$': /* insert currency symbol string */ 
strcpy(s, cur sym); 


sprintf(s, "$$9.*f", 
De fd && fd !- CHAR MAX ? fd: 0, d); 
end = strchr(s, p-»decimal point[01); 
for (ns = 0, i = end - s, g = grps; 0 « i; ++ns) 


{ /* count separators to add */ 
if (g[0] <= 0 II i <= g[0] || g(0] == CHAR MAX) 
break; 
i -= gl0]; 
if (gf1] != 0) 
++g; 
) 
memmove (end + ns, end, strlen (end) + 1); 
i= end - s, end += ns; 
*end = 0 <= fd && fd !- CHAR MAX ? dec pt : '\0'; 
for (g = grps; 0 « i; --ns) 
( /* copy up and insert separators */ 
if (g[0] <= 0 || å <= g[0] || g[0] == CHAR MAX) 
break; 


i -= g[0], end -= g[0]; 
memmove (end, end - ns, g[0]); 
*--end - grp sep; 
if(g[1] != 0) 
++g; 
) 
) 
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这 个 函数 简单 易 履 ， 但 它 包含 了 很 多 枯燥 的 内 容 。 前 半 部 分 简单 地 整 
理 了 符合 格式 化 情况 要 求 的 参数 集合 。 它 选择 一 个 格式 化 的 串 fmt 把 产生 
的 字符 送 到 缓冲 区 buf 中 。 注 意 ， 因 为 区 域 设置 可 以 改变 ， 所 以 这 些 代 码 
WA struct lconv 的 成 员 的 值 没有 意义 。 这 里 使 用 <stdio.h> 中 的 函数 
sprintf 把 double 类 型 的 值 a 转换 到 缓冲 区 中 。( 这 个 函数 还 有 很 多 其 他 功 
fik) sprintf 中 的 这 个 格式 串 保 证 了 缓冲 区 中 有 小 数 点 ， 如 果 有 数字 的 话 ， 
后 面 紧 接 着 就 是 小 数 的 位 数 。 

然后 ， 剩 下 的 工作 就 是 确定 要 在 小 数 点 左边 的 字符 之 间 插 入 多 少 分 隔 
符 ; 然后 把 这 些 分 隔 符 插入 到 这 些 字符 中 ; 然后 使 用 <string.h> 中 声明 的 
函数 memmove 把 这 些 字符 转移 到 缓冲 区 中 。 即 使 源 区 域 和 目标 区 域 有 重 释 ， 
那个 函数 也 会 保证 复制 的 正确 性 。 注 意 ， 函 数 把 sprintf〈 它 本 身 也 会 随 区 
域 设置 而 变化 ) 产生 的 小 数 点 用 选 定格 式 中 的 小 数 点 代替 。 

ED mutval — 。 要 使 用 函数 _Fmtval， 首 先 必 须 对 它 进 行 声明 并 且 定义 和 它 相关 的 宏 。 

虽然 可 以 设计 一 种 方法 把 这 些 信息 包含 在 头 文件 中 ， 但 我 并 没有 这 样 做 。( 参 
考 6.4 Hate.) 所 以 必须 加 上 下 面 的 内 容 : 


#define FV INTEGER -3 
#define FV INT CUR -2 
#define FV LCL CUR -1 
char * Fmtval (char *, double, int); 


把 这 几 行 代码 放 在 程序 的 最 上 面 ， 或 者 把 它们 放 在 一 个 单独 的 头 文件 中 ， 然 
后 包含 这 个 头 文件 。 这 样 就 可 以 通过 各 种 不 同 的 方式 调用 这 个 函数 了 。 例 如 
下 面 的 代码 : 


#include <stdio.h> 
char buf[100]; 


printf("You ordered %s sheets,", 
_Fmtval (buf, (double)nitems, FV INTEGER); 
printf(" each Se square cm.\n", 
 Fmtval(buf, size, 3); ， 
printf("Please remit %s to our New York office,\n", 
 Fmtval(buf, cost, FV INT CUR)); 
printf("(that's Sei Ann, 
 Fmtval(buf, cost, FV LCL CUR)); 


可 能 会 输出 以 下 内 容 : 


You ordered 1,340,000 sheets, each 1,204.787 square cm. 
Please remit USD 18,279 to our New York office, 
(that's $18,278.85). 


想象 一 下 这 种 方法 : 通过 直接 查看 struct lconv 的 内 容 ， 来 设法 产生 这 样 
MJÆR. BAG, pf Fmtval 的 作用 很 关键 。 


Z NULL 头 文件 <locale.h> 也 定义 了 空 指针 宏 NULL. $8 11 章 详细 地 讨论 了 这 
个 宏 。 
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6.4 <locale.h> 的 实现 


Æ 6-2 


<locale.h> 


的 调用 树 


这 一 章 的 代码 很 多 。 和 前 面 的 章节 不 同 的 是 ， 这 些 代码 涉及 了 C 标准 库 
的 所 有 部 分 。 在 前 面 的 部 分 ， 我 们 已 经 体会 到 了 函数 mai 的 复杂 。 它 使 
用 了 «sring.h» 中 的 字符 串 操 作 函 数 和 <stdio.h> 中 的 格式 输出 函数 。 你 
会 在 这 些 头 文件 和 后 面 其 他 的 一 些 头 文件 中 看 到 这 些 代 码 ， 我 们 不 能 对 每 一 
个 新 函数 都 作 很 详细 的 说 明 ， 只 描述 它们 的 某 些 特殊 用 法 〈 例 如 sprintt få 
式 "%#.*f")。 如 果 对 某 个 函数 不 熟悉 ， 可 以 到 后 面 的 某 个 章节 查找 相关 的 信 
息 


ayo 


这 里 有 一 些 指导 性 的 说 明 。 图 6-2 是 本 章 中 定义 的 具有 外 部 连接 的 函数 
和 数据 对 象 的 调用 树 。 我 用 括号 把 数据 对 象 的 实体 标识 出 来 了 。 每 一 个 外 部 
名 字 后 面 是 定义 它 的 C 源 文件 的 名 字 ， 以 及 该 源 文件 所 在 的 页 码 。 每 一 个 隔 
数 名 下 面 且 向 右 缩 进 一 个 制 表 符 处 是 该 函数 用 到 的 所 有 名 字 。( 后 面 涉 及 相 
同 的 函数 名 的 子 树 被 省 略 了 。) 


fin, RÅ setlocale 由 C 源 文件 setlocal.c 定义 。 该 函数 调用 了 它 
自己 ， 也 用 到 了 同一 个 源 文 件 中 定义 的 数据 对 象 Clocale， 同 时 它 也 调用 了 


函数 _pefloc、_Getloc 和 Setloc. 


如 果 不 能 理解 后 面 的 说 明 ， 可 以 时 常 回来 看 看 这 棵 调用 树 。 这 对 掌握 
«locale.h» 中 函数 的 整体 结构 有 很 大 的 帮助 。 


localeconv localeco.c,p. 97 
setlocale setlocal.c,p. 102 
setlocale setlocal.c,p. 102 
[ Clocale] setlocal.c,p. 102 
_Defloc xdefloc.c,p. 105 
_Getloc xgetloc.c,p. 104 
_Freeloc xfreeloc.c,p. 118 
[_Loctab] xloctab.c,p. 117 

_Makeloc xmakeloc.c,p. 120 
_Locvar xlocterm.c,p. 122 
 Locterm xlocterm.c,p. 122 

Skip xgetloc.c,p. 104 

_Readloc xreadloc.c,p. 115 
[_Loctab] xloctab.c,p. 117 

_Skip xgetloc.c,p. 104 

. Readloc xreadloc.c,p. 115 
_Setloc xsetloc.c,p. 106 
[_Costate] xstate.c,p. 107 
[_Mbcurmax] xstate.c,p. 107 
[_Mbstate] xstate.c,p. 107 
[_Westate] xstate.c,p. 107 
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函数 淘汰 
( knocking 
out ) 


头 文件 


<locale.h> 


函数 


localeconv 


setlocale 


的 实现 


注意 这 个 调用 树 中 没有 项 数 _Fmtval， 因 为 C 标准 没有 这 样 要 求 。 顺 便 
说 一 下 ，C 标准 允许 添加 函数 ， 所 以 它们 当然 可 以 使 用 像 _Fmtval 这 样 奇怪 
的 名 字 ， 它 们 甚至 可 以 用 像 fmtval 这 样 的 名 字 来 命名 。 为 了 整体 风格 的 一 
致 ， 我 选择 了 一 个 留 给 实现 人 员 使 用 的 名 字 。 


C 标准 不 允许 实现 对 该 函数 做 的 事情 有 : 


D 在 一 个 像 <locale.h> 的 标准 头 文件 中 包含 对 fmtval 的 声明 ; 
C 在 一 个 标准 头 文件 中 定义 形 如 FV INT CUR 的 宏 名 ; 
O 让 任意 的 C 标准 库 函 数 调用 fmtval。 


这 些 做 法 都 扰乱 了 为 用 户 保留 的 命名 空间 。 


考虑 一 下 那些 遵守 这 些 限 制 的 附加 的 库 函 数 会 怎么 样 。 若 程序 中 声明 或 
者 调用 了 那个 假想 的 fmtval eR, BEARS AAT C 标准 库 时 因为 不 恰 
当地 引用 了 外 部 名 字 而 包括 该 函数 ， 若 一 个 程序 自己 定义 了 fmtval， 连 接 
FANSEN CEN OE BARN AEE AHN RAS AX 
fmtval 的 出 现 而 受到 影响 ， 所 以 也 不 会 造成 任何 损失 。 用 户 提 供 的 函数 就 会 
将 附加 的 库 函 数 淘 汰 ， 因 此 所 有 可 以 通过 这 种 方式 被 淘汰 的 了 清 数 都 可 以 安全 
地 添加 到 C 标准 库 中 。 


不 管用 什么 样 的 名 字 ，_Fmtval 已 经 足够 了 。 本 章 的 剩余 部 分 将 会 讨论 
实现 C 标准 要 求 的 头 文件 <locale.h> 提供 的 服务 。 


实现 <locale.h> 的 最 简单 的 部 分 是 图 数 localeconv。 它 要 做 的 全 部 工 
作 就 是 返回 一 个 指向 描述 当前 区 域 设置 (或 者 它 的 一 部 分 ) 的 结构 的 指针 ， 
该 结构 的 类 型 为 struct lconv， 由 <locale.h> 定义 。 图 6-3 显示 了 文件 
locale.h， 图 6-4 显示 了 文件 localeco.c。( 后 者 的 名 字 被 缩减 为 8 个 字母 
是 为 了 满足 不 同系 统 的 命名 限制 ， 正 如 0.3 节 所 解释 的 。) ER localeconv 放 
在 一 起 的 是 struct lconv 类 型 的 静态 数据 对 象 ， 其 地 址 是 由 该 函数 返回 的 。 
注意 函数 localeconv 包含 了 <locale.h> 中 定义 的 隐 式 宏 。 


它 还 是 通过 包含 内 部 头 文件 <yvals .h> 来 对 头 文件 <locale.h> 进行 参 
BUL. (BE 3.4 节 中 对 这 个 头 文件 的 讨论 。) 它 人 允许 实现 定义 宏 NULL, A 
Jb, NULL 可 以 通过 修改 来 和 具体 的 实现 相 匹配 。( 参 考 第 11 章 中 对 NOLL 的 
Wie.) 在 多 数 情况 下 ，_NULL 的 一 个 合适 的 定义 为 : 

#define NULL (void zi 0 

KA setlocale 要 实现 很 多 功能 ， 调 用 这 个 函数 的 时 候 ， 该 函数 必须 根 
据 指定 的 类 别 和 名 字 决 定 选择 什么 区 域 设 置 。 它 还 要 找到 内 存 中 存在 的 区 域 设 
置 ， 或 者 从 一 个 文件 中 读 取 最 新 指定 的 区 域 设 置 。( 当然 ， 这 里 描述 的 是 一 般 
的 情况 。 一 个 最 简化 的 实现 只 可 以 识别 "C" 和 ”“" 区 域 设置 ， 这 两 个 区 域 设 
EET LAR.) 并 且 它 必须 返回 一 个 名 字 ， 以 便 以 后 恢复 当前 的 区 域 设置 。 


图 6-3 


locale.h 


<locale.h> 


/* locale.h standard header */ 
#ifndef LOCALE 

fdefine LOCALE 

#ifndef  YVALS 

#include «yvals.h» 

fendif 

/* macros */ 

fdefine NULL NULL 

/* locale codes */ 

#define LC ALL 0 
#define LC COLLATE 1 
#define LC CTYPE 2 
#define LC MONETARY 3 
#define LC NUMERIC 4 
#define LC TIME 5 
/* ADD YOURS HERE */ 
#define _NCAT 6 

/* type definitions */ 

struct lconv { 

/* controlled by LC_MONETARY */ 
char *currency symbol; 
char Sint curr symbol; 
char *mon decimal point; 


char *mon grouping; 


char *mon thousands sep; 
char *negative sign; 
char *positive sign; 
char frac, digits; 
char int, frac digits: 
char n cs precedes; 
char n sep by space; 
char n sign, posn; 
char p cs precedes; 
char p sep by. space; 
char p sign posn; 
/* controlled by LC NUMERIC */ 
char *decimal point; 
char *grouping; 
char *thousands, sep; 
3 
/* declarations */ 
struct lconv *localeconv(void); 
char *setlocale(int, const char *); 
extern struct lconv Locale; 
/* macro overrides */ 
#define localeconv() (& Locale) 
fendif 


/* one more than last */ 
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图 6-4 /* localeconv function */ 
localeco.c |#include <limits.h> 
#include <locale.h> 


/* static data */ 
static char null[] = ""; 
struct lconv _Locale = { 
/* LC MONETARY */ 
null, /* currency symbol 
nuli, /* int curr symbol 
null, /* mon decimal, point 
null, /* mon grouping 
null, /* mon, thousands, sep 
null, /* negative sign 
null, /* positive sign 
CHAR MAX, /* frac digits 
CHAR MAX, /* int frac, digits 
CHAR MAX, /* n, cs, precedes 
CHAR, MAX, /* n, sep by space 
CHAR MAX, /* n sign posn 
CHAR, MAX, /* p cs precedes 
CHAR, MAX, /* p sep by space 
CHAR, MAX, /* p sign posn 
/* LC NUMERIC */ 


p /* decimal point 
null, /* grouping 
null); /* thousands sep 


struct lconv * (localeconv) (void) 


{ /* get pointer to current locale 
return (& Locale); 


) 


混合 的 最 后 一 个 功能 是 最 难 的 ， 因 为 有 时 候 可 能 会 构建 一 个 混合 的 区 域 设置 ， 
KARE ”这 个 区 域 设 置 包括 各 种 不 同 的 区 域 设置 类 别 。 例 如 ， 可 以 像 这 样 编写 代码 : 


#include <locale.h> 
char *sl, s2; 


setlocale(LC ALL, ""); 

sl = setlocale(LC CTYPE, "C"); 

if ((s2 - malloc(strlen(s1) + 1))) 
strcpy (s2, sl); 


第 一 次 调用 选择 要 切换 到 本 地 区 域 设 置 一 一 某 一 个 适合 本 地 操作 环境 的 
区 域 设置 。 第 二 次 调用 恢复 为 "c" 区 域 设 置 。 必 须 对 sl 指向 的 串 进 行 备份 ， 
因为 中 间 调 用 setlocale 可 能 会 修改 这 个 串 。 如 果 后 面 做 了 以 下 调用 : 


setlocale(LC ALL, s2); 


区 域 设 置 就 会 恢复 到 以 前 的 混合 状态 。 
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区 域 设 置 的 
名 字 


头 文件 


"Xlocale.h" 


类 型 _Linfo 


<locale.h> 


setlocale 必须 设 定 一 个 名 字 ， 以 后 它 可 以 使 用 这 个 名 字 来 重建 各 种 混 
合 类 别 的 区 域 设置 。C 标准 没有 说 明 怎 么 做 ， 也 没有 规定 这 些 名 字 的 格式 ， 
只 说 了 一 个 实现 必须 这 样 做 。 


我 使 用 的 方案 是 如 果 一 个 区 域 设置 包含 了 混合 类 别 ， 就 在 它 的 名 字 中 
加 入 限定 词 。 例 如 ， 假 设 基本 的 区 域 设 置 是 "Usa* (这 个 区 域 设置 使 用 美国 
的 日 期 等 格式 )。 一 个 应 用 程序 想 让 类 别 LC MONETARY 适应 "acct" 区 域 设 
置 ( 这 个 区 域 设置 的 记 账 习惯 很 特殊 )， 那 么 这 个 混合 的 区 域 设 置 名 字 就 是 : 


"USA;monetary:acct", 


分 号 用 来 把 混合 区 域 设置 名 字 的 各 部 分 分 隔 开 。 在 每 一 部 分 中 ， 冒 号 用 
来 把 类 别名 字 和 它 的 区 域 设置 名 字 分 隔 开 。 基 本 区 域 设 置 没有 类 别 限 定 词 ， 
当 setlocale 构 建 一 个 名 字 时 ， 它 只 添加 那些 和 基本 区 域 设置 不 同 的 类 别 。 


实现 setlocale 和 它 的 后 续 函数 要 做 的 工作 比 图 6-2 中 的 函数 的 子 树 要 
多 。 它 需要 各 种 宏 、 类 型 定义 以 及 所 有 的 函数 和 数据 对 象 的 声明 。 其 实 这 就 是 
头 文件 的 作用 ， 即 用 来 存储 所 有 相互 协作 的 函数 之 间 共 享 的 信息 的 “仓库 ”。 


然而 ， 那 个 仓库 不 能 是 <locale.h>， 因 为 我 们 只 需要 在 某 个 特定 的 时 
期 在 <locale.h> 中 包含 setlocale 的 声明 ， 所 有 其 他 的 函数 声明 紧 随 其 
后 。 我 的 习惯 做 法 是 只 在 标准 头 文件 中 包含 那些 外 部 可 见 的 名 字 。 头 文件 
«locale.h» 还 声明 了 数据 对 象 Locale, ERNA localeconv 的 屏蔽 宏 
(masking macro) 引用 了 _Locale。 这 样 的 一 个 头 文件 已 经 很 完备 了 。 


我 创建 了 内 部 头 文件 "xlocale.h" 来 放置 其 他 的 东西 。 本 章 其 余 的 C 源 
文件 包含 了 这 个 内 部 头 文件 和 使 用 的 C 标准 库 中 的 所 有 其 他 函数 所 在 的 标准 
头 文件 。 反 过 来 ，"xlocale.h" 又 包含 了 <locale.h>， 它 也 包含 了 两 个 其 他 
的 内 部 头 文件 。"xlocale.h" 中 的 大 部 分 信息 的 作用 现在 都 不 能 体现 出 来 。 
因此 ， 在 本 章 后 面 才 给 出 它 的 全 部 内 容 ， 前 面 只 是 出 示 了 "xlocale.h" 中 那 
些 有 用 的 零碎 的 东西 。 


第 一 个 要 说 的 是 一 个 数据 结构 ， 它 包含 一 个 区 域 设置 的 全 部 信息 ， 所 
以 ， 它 一 定 要 包含 struct lconv 的 一 个 实例 ， 它 也 包含 一 些 指针 ， 这 些 指 
针 指 向 <ctype.h> 中 的 函数 _Ctype，_Tolower 和 Toupper 使 用 的 表 ; € 
还 包含 了 C 标 准 库 的 其 他 部 分 的 一 些 信息 。 可 以 说 ， 它 就 是 一 个 大 杂烩 。 
"xlocale.h" 定义 了 一 个 叫做 Linfo 的 数据 类 型 ， 其 形式 如 下 : 


typedef struct  Linfo { ~ 
const char * Name; /* must be first */ 
struct Linfo * Next; 
/* controlled by LC COLLATE */ 
.Statab  Costate; 
/* controlled by LC CTYPE */ 


类 型 statab 


头 文件 


"xstate.h" 
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const short * Ctype; 
const short * Tolower; 
const short * Toupper; 
unsigned char  Mbcurmax; 
.Statab ' Mbstate; 
.Statab  Wcstate; 

/* controlled by LC MONETARY and LC, NUMERIC */ 
struct lconv | Lc; 

/* controlled by LC TIME */ 
_Tinfo Times; 
) Linfo; 


最 初 ， 这 个 结构 中 只 存在 一 个 实例 一 一 setlocal.c 中 定义 的 数据 对 象 
_Clocale。_Clocale 的 成 员 Name 有 一 个 非 零 的 初始 值 ， 它 指向 区 域 设置 
AF: 串 "c"。( 这 就 是 该 名 在 结构 体 中 第 一 次 出 现 的 地 方 。) 对 setlocale 
的 第 一 次 调用 所 做 的 是 在 区 域 设 置 改 变 之 前 把 区 域 设 置 指定 的 信息 复制 到 这 
个 数据 对 象 中 。 后 来 的 调用 就 可 以 简单 地 通过 把 相关 的 信息 复制 出 来 而 恢复 
到 "c" 区 域 设 置 。 


如 果 函 数 _Getloc 想 要 读 人 一 个 新 的 区 域 设置 (就 像 本 章 后 面 所 描述 的 
那样 )， 这 个 函数 就 会 为 一 个 新 的 _Linfo 实例 分 配 空间 ， 并 且 把 _Clocale 
复制 进去 。 然 后 Getloc 读 人 这 个 区 域 设置 的 所 有 改变 。 如 果 所 有 的 改变 
都 是 有 效 的 ， 函 数 就 把 这 个 新 的 区 域 设置 添加 到 一 个 以 _Clocale._Next 为 
表 头 的 可 变 的 区 域 设置 链表 中 。 链 表 中 的 一 个 结 点 的 成 员 Next 为 一 个 空 指 
针 ， 这 个 结 点 为 该 链表 的 表 尾 。( 注 意 ，_Linfo 在 这 个 声明 中 既 作为 类 型 名 ， 
又 作为 结构 标签 。 只 有 拥有 一 个 标签 名 的 结构 才能 包含 一 个 指针 ， 这 个 指针 
指向 这 个 结构 的 另 一 个 实例 ) 


结构 _Linfo 包含 了 几 个 Statab 类 型 的 成 员 。 在 这 个 C 标准 库 的 实现 
中 ， 某 些 函 数 使 用 状态 表 来 定义 它们 的 行为 。 这 就 为 提高 性 能 提供 了 最 大 的 
灵活 性 。 它 也 允许 使 用 和 <ctype.h> 中 的 转换 表 相 似 的 符号 来 指定 这 些 函 数 
在 一 个 区 域 设置 中 的 行为 。 下 面 是 受到 影响 的 几 个 函数 。 


O <string.h> 中 声明 的 strcoll 和 strxfrm， 为 定义 一 个 整理 顺序 把 
一 个 字符 串 转换 为 另 一 个 字符 串 。 

D <stdlib.h> 中 声明 的 mbtowc 和 mbstowcs， 把 一 个 多 字 节 串 转 换 为 
一 个 宽 字 节 字符 趾 。 

C) <stdlib.h> 中 声明 的 wctomb 和 wcstombs， 把 一 个 宽 字 节 字 符 串 转 
换 为 一 个 多 字 节 串 。 

我 会 在 后 面 的 章节 中 描述 这 些 函 数 的 行为 。 现 在 ， 我 发 现 内 部 头 文件 
"xstate" 定义 了 类 型 Statab 和 几 个 有 用 的 宏 ， 并 且 声 明了 statab 类 型 
的 各 种 数据 对 象 。 内 部 头 文件 "xlocale.h" 包含 了 头 文件 "xstate.h"， 以 便 
区 域 设 置 改变 时 获得 操作 状态 表 所 需 的 信息 。 图 6-5 显示 了 头 文件 xstate.h。 
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<locale.h> 


一 一 


图 6-5 


xstate.h 


类 型 Tinfo 


头 文 件 


"xtinfo.h" 


Fd 6-6 


xtinfo.h 


/* xstate.h internal header */ 


/* macros for finite state machines */ 


#define ST CH 

#define ST STAT 
#define ST STOF 
#define ST FOLD 
#define ST INPU 
#define ST OUTP 
#define ST ROTA 
#define _NSTATE 


Ox00fE 
E 0x0£00 
F 8 
0x8000 
T 0x4000 
UT 0x2000 
TE 0x1000 
16 


/* type definitions */ 


typedef struct 


( 


const unsigned short * Tab[ NSTATE]; 


) _Statab; 
/* decl 


arations */ 


extern  Statab  Costate, , Mbstate, Wcstate; 


261p Hh, <time.h> 中 声明 的 函数 也 有 区 域 设置 指定 的 行为 。 结 构 类 型 
_Tinfo 包含 了 几 个 指向 以 空 字符 结尾 的 字符 串 的 成 员 。 这 些 串 用 来 控制 时 间 
函数 输出 和 转换 日 期 和 时 间 的 方式 。 


内 部 头 文件 "xtinfo.h" 定义 了 类 型 Tinfo 并 声明 了 _Tinfo 类 型 的 数 
据 对 象 -Times， 这 个 数据 对 象 保存 了 关于 时 间 的 当前 信息 。 "xlocale.h" 也 
包含 了 "xtinfo.h"， 以 便 区 域 设置 改变 时 获得 操作 时 间 信 息 所 需 的 信息 。 图 
6-6 显示 头 文件 xtinfo-h, 


现在 可 以 来 看 一 下 函数 setlocale 都 做 了 些 什 么 。 图 6-7 显示 了 文件 
setlocal.c。 它 的 主要 功能 是 分 析 一 个 名 字 来 决定 每 个 类 别 使 用 哪 种 区 域 设 
置 。 另 外 一 个 主要 功能 是 构建 一 个 setlocale 以 后 可 以 识别 的 名 字 。 相 比 之 
下 ， 其 他 的 东西 就 显得 不 是 那么 重要 了 。 


/* xtinfo.h internal header */ 


/* type 
typedef struct 
const char 
const char 
const char 
const char 
const char 
const char 

) _Tinfo; 


definitions 
( 

* Ampm; 

* Days; 

* Formats; 

* Isdst; 

* Months; 

* Tzone; 


/* declarations */ 


extern  Tinfo Times; 


*/ 


图 6-7 


setlocal.c 
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/* setlocale function */ 
#include «ctype.h» 
#include <string.h> 
#include "xlocale.h" 


#if NCAT != 6 

#error WRONG NUMBER OF CATEGORIES 

#endif 

/* static data */ 

_Clocale = {"C"); 

char *curname = "C"; 

static char namalloc = 0; 

static const char * const nmcats[ NCAT] = { 
NULL, "collate:", "ctype:", 
"numeric:", "time:"); 

Static Linfo *pcats [ NCAT] = ( 
& Clocale, & Clocale, & Clocale, 
& Clocale, & Clocale ); 


_Linfo 
static 


"monetary:", 


& Clocale, 


char *(setlocale) (int cat, const char *lname) 
{ 
size t i; ^ 

if (cat < 0 || _NCAT «<= cat) 
return (NULL); 

if (lname == NULL) 
return (curname); 

if (lname[0] == '\0') 
iname = Defloc(); 


/* curname allocated */ 


/* set new locale */ 


/* bad category */ 


if ( Clocale. Costate. Tab[0)] == NULL) 
{ /* fill in "C" locale */ 
 Clocale. Costate =  Costate; 
.Clocale. Ctype = _Ctype; 
.Clocale. Tolower = | Tolower; 
.Clocale. Toupper =  Toupper; 
 Clocale. Mbcurmax = Mbcurmax; 
.Clocale. Mbstate = | Mbstate; 
.Clocale. Wcstate =  Wcstate; 
 Clocale. LC - Locale; 
 Clocale. Times = Times; 
) /* set categories */ 
{ 
_Linfo *p; 


int changed = 0; 


if (cat != LC ALL) 
{ /* set a single category */ 
if((p = _Getloc(nmcats[cat], lname)) == NULL) 


return (NULL); 
if (p != pcats [cat]) 
pcats[cat] =  Setloc(cat, p), 


changed - 1; 


/* set all categories */ 


if 


for (i ; ++i < _NCAT;) 
{ /* set a category 
if ((p = _Getloc(nmcats[il, lname)) == NULL) 
{ /* revert all on any failure 
setlocale(LC ALL, curname) ; 
return (NULL); 


) 
if (p != pcats[i]) 
pcats[i] = Setloc(i, p), changed - 1; 


H 
if((p = Getloc("", lname)) != NULL) 
pcats[0] = p: /* set only if LC, ALL component 
H 
(changed) 
{ /* rebuild curname 
char *s; 
size_t n; 
size_t len = strlen(pcats[0]->_Name); 


for (i = 0, n = 0; ++i < _NCAT; ) 
if (pcats[i] != pcats[0]) 
{ /* count a changed subcategory 
len += strlen(nmcats[i]) 
+ strlen(pcats[i]-> Name) + 1; 
++n; 
) 
if (n == 0) 
{ /* uniform locale 
if (namalloc) 
free (curname) ; 
curname = (char *)pcats[l]-> Name, namalloc = 0; 
} 
else if ((s = (char *)malloc(len + 1)) == NULL) 
{ /* may be rash to try to roll back 
setlocale(LC_ALL, curname) ; 
return (NULL); 
} 
else 
{ /* build complex name 
if (namalloc) 
free (curname) ; 
curname = s, namalloc = 1; 
S += strlen(strcpy(s, pcats[(0]->_Name) ); 
for (i = 0; ++i < _NCAT; ) 
if (pcats[i] != pcats[0]) 
{ /* add a component 
*S++ = Cap! 
S += strlen(strcpy(s, nmcats[i])); 
S += strlen(strcpy(s, pcatsf[i]-> Name)); 


) 


return (curname); 


) 
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函数 Getloc 


HD skip 


函数 Defloc 


函数 setioc 


区 域 设置 文件 


setlocale 包含 了 一 些 代 码 ， 这 些 代码 在 第 一 次 尝试 改变 区 域 设 置 的 时 
候 把 信息 复制 到 "c" 区 域 设置 中 。 我 采用 了 这 种 方法 来 避免 麻烦 的 雪 球 效应 。 
把 各 种 区 域 设置 指定 的 表 装 入 一 个 结构 中 很 容易 。 然 而 ， 这 样 做 不 管用 到 多 少 
东西 都 会 得 到 整个 雪 球 。 我 认为 让 setlocale 多 做 点 工作 来 避免 这 个 问题 会 
更 好 。 你 肯定 不 希望 只 是 在 使 用 函数 isspace 的 时 候 就 插入 10KB 的 代码 。 


函数 Getloc 用 来 确定 内 存 中 是 否 存 在 一 个 和 给 定 类 别 对 应 的 区 域 设 
置 。 如 果 不 存在 ， 则 Getloc 通过 读 取 一 个 区 域 设置 文件 来 寻找 它 。 下 面 会 
详细 地 讨论 这 个 文件 的 读 取 。 图 6-8 显示 了 定义 该 函数 的 文件 xgetloc.c。 


C 源 文件 xgetloc.c the MT pA _sSkip。 有 几 个 读 取 区 域 设置 文件 的 
函数 调用 Skip 来 跳 过 一 个 字符 (而 不 是 空 字 符 ) 和 后 面 紧 跟 的 空白 。 这 
里 ， 空 白 由 空白 符 和 水 平 制 表 符 组 成 。 使 用 Skip 可 以 统一 区 域 设 置 文件 中 
对 空白 的 定义 ， 也 可 以 简化 后 面 的 很 多 代码 。 


图 6-9 显示 了 源 文 件 xaefloc.c。 它 定义 了 确定 本 地 区 域 设置 名 字 的 函 
数 _pefloc。 为 了 确定 那个 名 字 ， 我 选择 使 用 环境 变量 "LOCALE". iX mg 
定时 区 的 环境 变量 "Tz" 很 相似 。 在 程序 执行 过 程 中 ，_pefloc 最 多 检查 环 
境 变 量 LOCALE 一 次 。 

图 6-10 显示 了 文件 xsetloc.c。 它 定义 了 函数 _Setloc， 这 个 函数 实际 
上 是 把 新 的 信息 复制 到 受 区 域 设置 改变 影响 的 静态 数据 的 各 个 位 中 。( 注 意 
它 也 执行 了 一 点 检查 更 关键 的 值 的 功能 .) 因此 ， 调 用 setlocale 就 会 引入 
所 有 这 样 的 信息 。 我 不 知道 怎样 避免 这 种 特殊 的 雪 球 。 但 至 少 如 果 把 区 域 设 
置 放 到 一 边 不 管 ， 就 可 以 避免 了 。 

为 了 使 文档 完整 ， 这 里 给 出 了 初始 的 状态 表 ， 因 为 setlocale 和 
_Setloc 都 对 状态 表 进 行 了 操作 。( 时 间 信 息 Times 存储 在 文件 asctime.c 
中 ， 见 15.4 节 。) 图 6-11 显示 了 文件 xstate.c。 不 要 想 深入 地 理解 它 。 现 
在 ,我 只 能 说 下 面 给 出 的 这 个 状态 表 适 用 于 所 有 使 用 状态 表 的 函数 。 它 巧妙 
的 设计 能 产生 对 所 有 这 些 函 数 有 用 的 《如 果 简 单 的 话 ) 结果 。 它 也 为 在 区 域 
设置 文件 中 定义 状态 表 开 了 个 好 头 。 


到 目前 为 止 ， 我 已 经 介绍 了 支持 区 域 设 置 的 所 有 基本 的 机 制 。 这 些 
机 制 对 于 在 库 中 构建 附加 的 区 域 设 置 已 经 足够 了 。 只 要 添加 类 型 struct 
lconv 的 静态 声明 并 对 它们 进行 合适 的 初始 化 就 可 以 了 。 但 是 要 保证 
_Clocale._Next 指向 你 增加 的 链表 。 


然而 ， 区 域 设置 的 真正 乐趣 是 定义 一 个 无 限 集合 的 前 景 。 为 了 实现 它 ， 
需要 在 不 改变 C 代码 的 前 提 下 指定 一 个 区 域 设置 。 这 就 要 用 到 前 面 的 图 6-2 
中 还 没有 说 明 过 的 所 有 剩余 机 制 。 在 讲述 这 种 机 制 之 前 ， 必 须要 先 讲 一 下 区 
域 设 置 文件 。 


图 6-8 


xgetloc.c 


<locale.h> 


/* Getloc and Skip functions */ 
#include <stdio.h> 

#include <stdlib.h> 
#include <string.h> 
#include "xlocale.h" 


const char *_Skip(const char *s) 
{ /* skip next char plus white-space */ 
return (*s == "Di ? s : s + 1 + strspn(s + 1, "NE")); 


) 


Linfo * Getloc(const char *nmcat, const char *lname) 
{ /* get locale pointer, given category and name */ 
const char *ns, *s; 
size_t nl; ' 

.Linfo *p; 


{ 
size tn; 


/* find category component of name 


for (ns NULL, s = lname; ; s += n + 1) 
Í /* look for exact match or LC ALL */ 
if (s[n = strcspn(s, ":;")] == "NO" || sin} = ";") 
{ /* memorize first LC_ALL */ 
if (ns == NULL) ` 


ns = s, nl = ng ` 
if (s[n] == '\0'} 
break; 
) 
else if (memcmp(nmcat, s, ++n) == 0) 
{ /* found exact category match */ 
ns = s +n, nl = strespn(ns, ";"); 
break; s 
H - 
else if (s[n += strcspn(s + n, ";")] == '\0') 
break; 
H 
if (ns == NULL) 
return (NULL); /* invalid name */ 


) 
for (p = & Clocale; p; p = p-> Next) 
if (memcmp(p-» Name, ns, nl) == 


&& p-> Nameínl] == '\0') 

return (p); 
( /* look for locale in file */ 
char buf [MAXLIN], *s1; 
FILE *1f; 


_Locitem *q; 
static char *locfile; 


/* locale file name 


if (locfile) 
else if ((s = getenv("LOCFILE")) == NULL 

Il ((locfile = malloc(strlen(s) +1))) == NULL) 
return (NULL); 
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(BE) 


图 6-9 


xdefloc.c 


else 

strepy(locfile, s); 
(1f = fopen(locfile, 

return (NULL); 

while ((q = Readloc(lf, buf, 

if (q-> Code == L_NAME 
&& memcmp(s, ns, nl) 
&& * Skip(s + nl - 1) 


if ( "r")) 


- NULL; 
else if ((p = 


H 


} 


/* _Defloc function */ 
#include <stdlib.h> 
#include <string.h> 
#include "xlocale.h" 


const char * Defloc (void) 
{ 
char *s; 
static char *defname = NULL; 

if (defname) 

i 

else if ((s = getenv("LOCALE") ) 
&& (defname = 
strepy(defname, s); 


else 

defname = "C"; 
return (defname) ; 
} 


&s)) 


malloc(sizeof ( Linfo))) 


else if ((sl = malloc(nl + 1)) == NULL) 
free(p), p = NULL; 
else 
{ /* build locale */ 
*p = _Clocale; 
p-> Name = memcpy(sl, ns, nl); 
si[nl] = 'NO'; 
if ( Makeloc(1f, buf, p)) 
p-> Next = Clocale. Next,  Clocale. Next = p; 
else 
{ /* parsing error reading locale file */ 
fputs(buf, stderr); 
fputs("\n-- invalid locale file line\n", stderr); 
_Freeloc(p) ; 
free(p), p = NULL; 
} 
} 
fclose(1f); 
return(íp); 
) 


malloc(strlen(s) 


== NULL) 


!= NULL) 


NULL) 


/* find name of default locale */ 


NULL 
+ 1)) 


!1= NULL) 
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xsetloc.c 


/* _Setloc function */ 
#include «ctype.h» 
finclude «limits.h» 


#include "xlocale.h" 


_Linfo * Setloc(int cat, Linfo 


{ /* set category for locale */ 
switch (cat) 


{ /* set a category */ 

case LC_COLLATE: 
_Costate = p->_Costate; 
break; 

case LC_CTYPE: 
_Ctype = p-> Ctype; 
_Tolower = p->_Tolower; 
_Toupper = p->_Toupper; 
_Mbcurmax = p->_Mbcurmax <= MB LEN MAX 

? p->_Mbcurmax : MB_LEN MAX; 

_Mbstate = p->_Mbstate; 
 Wcstate = p->_Wcstate; 
break; 

case LC_MONETARY: 
_Locale.currency_symbol = p-> Lc.currency symbol; 
 Locale.int curr symbol = p-» Lc.int curr symbol; 
.Locale.mon decimal point = p-» Lc.mon decimal point; 
 Locale.mon grouping = p-» Lc.mon grouping: 
 Locale.mon thousands sep = p-» Lc.mon thousands sep; 
 Locale.negative sign = p-» Lc.negative sign; 
 Locale.positive sign = p-» Lc.positive sign; 
 Locale.frac digits = p-» Lc.frac digits; 
 Locale.int frac digits = p-» Lc.int frac digits; 
 Locale.n cs precedes = p-» Lc.n, cs precedes; 
 Locale.n sep by space = p-> Lc.n sep by space; 
 Locale.n sign posn = p-» Lc.n sign posn; 
 Locale.p cs precedes = p-> Lc.p, cs precedes; 
 Locale.p sep by space = p-» Lc.p sep by space; 
 Locale.p sign posn = p-» Lc.p sign posn; 
break; 

case LC NUMERIC: 
 Locale.decimal point = p-» Lc.decimal point [0] != '\0' 

? p-> Lc.decimal point : "."; 

_Locale.grouping = p-> Lc.grouping; 
 Locale.thousands sep = p-»,Lc.thousands sep; 
break; 

case LC TIME: 
_Times= p-> Times; 
break; 
) 

return(p); 


} 
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图 6-11 


xstate.c 


/* Costate, Mbstate, and Wcstate generic tables */ 
#include limite ba 

#include "xlocale.h" 

#if UCHAR MAX != 255 

#error WRONG STATE TABLE 

#endif 


/* macros */ 
#define X (ST_FOLD|ST_OUTPUT|ST_INPUT) 


/* static data */ 
static const unsigned short tab0[257] = {0, /* alloc flag */ 
X|0x00, X[OxO1, X|0x02, x|0x03, X|0x04, X[0x05, X|0x06, x 0x07, 
x|0x08, 0x09, x|0x0a, X|Ox0b, x|OxOc, x|OxOd, X|OxOe, X|OxOf, 
X|0xi0, X[Ox11, X|0x12, X|Ox13, X|Ox14, X|Ox15, XlOx16, X|Ox17, 
X|0x18, 0x19, X|Oxla, X|Oxlb, X|Ox1c, x|Ox1d, x|Oxle, X|Ox1f, 
X[0x20, X[Ox21, X[0x22, X[0x23, X[0x24, X|0x25, x|0x26, X|0x27, 
X|0x28, X|0x29, x|0x2a, X|0x2b, x|0x2c, x|0x2d, x|Ox2e, X|Ox2f, 
X|0x30, X|0x31, X|0x32, X|Ox33, X|Ox34, X|0x35, X|0x36, X|0x37, 
X|0x38, 0x39, x|0x3a, X|Ox3b, X|0x3c, X|0x3d, X|Ox3e, X|Ox3f, 

X 
X 
X 
X 
x 
x 
X 
X 


X|0x40, x|Ox41, X|0x42, X|0x43, X|0x44, X|0x45, X|Ox46, X|0x47, 
X|0x48, X|0x49, x|0x4a, X|Ox4b, X|0x4c, X|0x4d, X|Ox4e, X|Ox4f, 
X|0x50, X|0x51, X|0x52, X|0x53, X|0x54, X|0x55, X|Ox56, X|0x57, 
X|0x58, X|0x59, X|0x5a, X|Ox5b. X|0x5c, X|0x5A, x|OxSe, x|Ox5f, 
X|0x60, x|0x61, X|0x62, X|0x63, X[0x64, x|0x65, X|0x66, X|0x67, 
X|0x68, X|0x69, x|0x6a, X|Ox6b, X|0x6c, x|Ox6d, x|Ox6e, X|0x6f, 
X|0x70, X|Ox71, X|0x72, X|0x73, X|0x74, X|0x75, X|Ox76, 0x77, 
X|0x78, X|0x79, x|0x7a, X|Ox7b, x|O0x7c, x]Ox7d, x]Ox7e, Ox7f, 


P4 P4 P4 WM P4 P4 PA P4 P4 p PDA M 


X|0x80, X|0x81, X|0x82, X|Ox83, X|Ox84, X|0x85, X|0x86, X|0x87, 
X|0x88, X|0x89, X|Ox8a, X|Ox8b, x|0x8c, X|Ox8d, x|Ox8e, X|0x8f, 
X|0x90, x|0x91, X|0x92, X|0x93, X|0x94, X|0x95, X|0x96, X|0x97, 
X|0x98, x|0x99, x|0x9a, X|Ox9b, x|Ox9c, X|0x9d, X|Ox9e, X|Ox9£, 
X|0xa0, X|Oxal, X|0xa2, X|0xa3, X|Oxa4, X|0xa5, X|Oxa6, X|0xa7, 
X|0xa8, x|0xa9, X|0xaa, X|Oxab, X|Oxac, X|Oxad, x|Oxae, X|Oxaf, 
X|0xbO, X|Oxb1, X|Oxb2, X|Oxb3, X|Oxb4, X|O0xb5, X|Oxb6, X|0xb7, 
X|0xb8, X|0xb9, X|Oxba, X|Oxbb, X|0xbc, X|Oxbd, X|Oxbe, X|Oxbf, 
x|0xc0, x|0xc1, X|0xc2, X|Oxc3, x|O0xc4, X|O0xc5, x|Oxc6, X|0xc7, 
X|0xc8, X|Oxc9, x|0xca, X|Oxcb, x|0xcc, X|0xcd, X|Oxce, X|Oxcf, 
X|0xdO0, x|Oxdi, X|0xd2, x|Oxd3, X[Oxd4, X|O0xd5, Xx|Oxd6, X[|Oxd7, 
X|0xd8, x|0xd9, x|Oxda, x|Oxdb, X|Oxdc, X|Oxdd, X|Oxde, Xx|Oxdf, 
X|0xeO, x|0xei, X|0xe2, X|0xe3, X|Oxe4, X|0xe5, X|0xe6, X|0xe7, 
X|0xe8, x|0xe9, X|Oxea, X|Oxeb, X|Oxec, X|Oxed, X|Oxee, X|Oxef 
X[Oxf0, X[Oxfl, X[O0xf2, X[Oxf3, X[Oxf4, X[Oxf5, X|Oxf6, X[Oxf7, 
X|0x£8, x|Oxf9, X|Oxfa, X|Oxfb, X|Oxfc, X|Oxfd, X|Oxfe, X|Oxff, 
}; 


char Mbcurmax = 1; 


_Statab  Costate = (&tab0[1]); 
_Statab _Mbstate = {&tab0[1]}; 
.Statab Wcstate = (&tabO[1]):; 口 
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"LOCALE" 


"LOCFILE" 


一 个 区 域 设 置 应 该 很 容易 定义 。 各 种 各 样 的 人 都 有 机 会 定义 一 个 区 域 设 
置 的 部 分 或 者 全 部 。 不 同 的 人 群 可 能 希望 : 

D 使 用 当地 的 习惯 和 当地 的 语言 打印 日 期 和 时 间 ; 

C) 改变 用 来 读 取 、 转 换 和 输入 浮 点 值 的 小 数 点 ; 
指定 当地 货币 格式 和 符号 ; 
指定 特殊 的 比较 顺序 ; 

在 <ctype.h> 中 声明 的 函数 定义 的 字符 分 类 中 添加 字符 、 标 点 符号 
或 者 控制 符号 ; 

O 改变 多 字 节 和 宽 字 节 字 符 的 编码 方式 。 

这 些 改变 大 致 是 按照 复杂 性 递增 的 顺序 列 出 的 。 几 乎 每 个 人 都 可 能 想 把 
月 份 和 星期 的 名 字 改 变 为 另 一 种 语言 。 某 些 人 可 能 会 定义 一 个 特殊 的 整理 顺 
序 。 而 只 有 最 勇敢 的 人 才 会 考虑 修改 成 一 种 新 的 多 字 节 字符 编码 方式 〈 首 先 ， 
它 可 能 与 翻译 器 产生 的 字符 串 字面 量 和 字符 常量 不 一 致 )。 不 过 ， 这 些 操作 
中 没有 一 个 要 求 C 标准 库 作 出 改变 。 

因此 ， 我 们 的 目标 是 设计 一 种 方法 。 通 过 这 种 方法 ， 普 通 人 也 可 以 定义 
一 个 新 的 区 域 设置 并 在 程序 运行 时 引入 到 程序 中 。 当 然 ， 这 个 程序 一 定 会 在 
某 种 条 件 下 调用 setlocale， 并 且 一 定 要 使 用 这 次 调用 所 修改 的 信息 。 在 给 
定 了 这 些 明显 的 先决 条 件 之 后 ，C 标准 库 应 该 有 助 于 程序 和 用 户 在 区 域 设 置 
规范 方面 保持 一 致 。 

采用 的 方法 是 引入 两 个 环境 变量 和 一 个 文件 格式 。 环 境 变量 如 下 。 

C) "LOCALE" (HAIEK) “Ar Deflo” WPAP: 它 指定 了 一 个 

本 地 区 域 设置 的 名 字 ， 这 个 名 字 是 由 setlocale(LC ALL, "") 这 样 的 
调用 被 选择 。 

O "LOCFILE"; 如 果 setlocale 遇 到 了 一 个 内 存 中 不 存在 的 区 域 设置 名 

字 ， 它 就 指定 一 个 可 以 使 用 的 区 域 设置 文件 的 名 字 。 
文件 格式 指定 了 准备 文本 文件 的 方法 ， 这 样 它 就 可 以 定义 你 想 添加 的 所 有 附 
加 的 区 域 设置 。 

例如 ， 一 个 叫做 oooc 的 程序 开始 先 调用 上 面 的 setlocale (LC_ALL,"")。 

ZC MS-DOS 下 ， 可 以 从 一 个 批 处 理 文件 中 调用 它 : 


set LOCFILE=c:\locales\mylocs.loc 
set LOCALE=USA 
XXX 


这 会 让 程序 eex 读 取 文 件 c:\locales\mylocs.inc 来 搜索 区 域 设 置 名 
"Usa" 。 假 设 程序 可 以 找到 该 区 域 设置 并 且 成 功 地 读 和 人 ， 那 么 程序 e 就 可 
以 采用 适合 "USA" 区 域 设置 的 行为 来 执行 。 在 批 处 理 脚 本 中 把 "USA" obt 
"France"， 程 序 就 会 在 同一 个 文件 中 找 出 一 个 不 同 的 区 域 设置 。 或 者 可 以 修 
改 由 "LOCFILE" 指定 的 文件 名 ， 然 后 总 是 搜索 一般 的 "native" 区 域 设置 。 
这 两 种 方法 都 是 修改 本 地 区 域 设置 的 明智 的 方法 。 


aonad 


区 域 设 置 文件 
格式 


数字 值 


6.4 <locale.h> 的 实现 109 


一 个 更 复杂 的 程序 可 能 不 仅仅 使 用 本 地 区 域 设 置 ， 它 可 能 会 通过 各 种 不 
同 的 方式 确定 类 别 和 区 域 设 置 的 名 字 ， 然 后 让 setlocale 把 它们 从 区 域 设置 
文件 中 找 出 来 。 而 且 程序 在 运行 的 时 候 ， 甚 至 可 能 重新 写 人 区 域 设 置 文件 的 
内 容 ， 以 迅速 建立 新 的 区 域 设置 。 如 果 以 上 任 一 种 情况 发 生 了 ， 要 尽量 推迟 
区 域 设置 和 程序 绑 定 的 时 间 。 


一 个 区 域 设置 由 各 种 数据 类 型 组 成 。 一 些 是 数字 值 ， 一 些 是 字符 串 ， 还 
有 一 些 是 变化 格式 的 表 。 区 域 设置 中 的 每 一 个 实体 都 要 有 一 个 不 同 的 名 字 。 
当 写 人 区 域 设置 文件 来 指定 希望 重新 定义 的 实体 时 ， 就 会 用 到 这 些 名 字 。 对 
T struct lconv 中 的 成 员 ， 使 用 成 员 名 作为 区 域 设置 文件 中 的 实体 名 。 其 
他 情况 下 ， 必 须 自己 为 实体 命名 。 


区 域 设置 文件 被 组 织 为 一 个 文本 行 的 序列 。 例 如 ， 可 以 用 下 面 一 行 开始 
"USA" 区 域 设置 的 定义 ; i 


LOCALE USA 


以 后 的 每 一 行 都 以 一 个 预先 定义 的 列表 中 的 关键 字 开 头 。 使 用 NOTE 开始 一 
行 注释 ， 使 用 SET 来 指定 一 个 大 写字 母 的 值 ， 就 像 下 面 的 一 样 ; 


NOTE The following sets D(elta) to 'a'-'A' 
SET D 'a! - "Ai 


然后 就 可 以 使 用 D 作为 表达 式 中 的 一 个 项 。 
如 果 关 键 字 是 一 个 实体 名 ， 可 以 在 这 一 行 的 剩余 地 方 指定 它 的 值 ， 例 如 : 


currency symbol $ 

int curr symbol "USD" 

frac digits 2 

一 个 串 值 周围 的 引号 是 可 选 的 。 只 有 在 需要 把 空白 作为 串 的 一 部 分 的 时 
候 才 有 必要 使 用 引号 。 可 以 在 任何 要 求 数字 值 的 地 方 写 一 个 相当 复杂 的 表达 
式 。 本 节 后 面 会 详细 地 讨论 表达 式 。 


每 一 个 新 的 区 域 设 置 的 初始 值 都 能 和 “"c" 区 域 设置 中 的 相 匹 配 。 这 样 就 
节省 了 很 多 输入 的 工作 。 真 正 需 要 指定 的 是 "O 区 域 设置 中 改变 的 东西 。 只 
有 当 需 要 一 个 区 域 设置 的 更 多 完整 文档 的 时 候 ， 才 可 能 输入 更 多 的 东西 。 


需要 为 struct lconv 的 某 些 成 员 指定 数字 值 。 这 些 值 包括 下 面 那 些 
LC MONETARY 类 别 的 信息 ， 


frac digits 

int frac digits 
n cs precedes 
n sep by spaces 
n sign posn 

p. cs precedes 

p sep by spaces 
p sign posn 
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字符 串 值 


数字 串 


这 些 信 息 中 的 每 一 个 都 占据 一 个 char 类 型 成 员 。<1limits.h> 中 定义 的 
CHAR MAX 的 值 说 明 它 没有 提供 任何 有 意义 的 值 。 

«locale.h» 中 定义 的 宏 MB CUR MAX 的 值 ， 可 以 随 着 Lc CTYPE 类 别 而 
改变 。 我 采用 实体 名 

mb cur max 
作为 保存 这 个 宏 值 的 char 类 型 的 数据 对 象 的 名 字 。 

需要 为 struct lconv 的 某 些 成 员 指 定 字 符 串 。 这 些 成 员 包 括 
LC MONETARY 类 别 的 信息 


currency symbol 
int curr symbol 
mon decimal point 
mon thousands sep 
negative sign 
positive sign 


和 LC NUMERIC 类 别 的 信息 
decimal point 
thousands sep 


顺便 说 一 下 需要 注意 的 地 方 , CR ME Å Jy mon decimal point, mon. 
thousands sep, decimal point 和 thousands sep 都 是 长 度 为 1 的 字符 
串 。 无 论 它 们 是 什么 ， 这 个 实现 中 的 函数 都 使 用 每 个 串 的 第 一 个 字符 。 

需要 为 struct lconv 的 某 些 成 员 指定 数字 串 ， 它 们 包括 : 


grouping (LC NUMERIC) 
mon grouping (LC MONETARY) 


每 一 个 字符 的 值 指定 了 十 进 制 小 数 点 左边 要 分 组 的 字符 数 。 一 个 零 值 使 串 结 
束 并 且 导 致 最 后 一 个 分 组 值 重 复 不 确定 次 。 一 个 CHAR. MAX 值 也 会 终止 字符 
串 ， 且 说 明 分 组 结束 。 例 如 ， 为 了 先 用 2 然后 使 用 5 对 数字 进行 分 组 ， 就 会 
想到 创建 数组 {2,5,CHAR_MAX} 。 然 而 ， 在 区 域 设置 文件 中 ， 可 以 写 : 

mon grouping 25^ 
对 于 数字 串 ， 每 一 个 十 六 进 制 数字 都 被 它 的 数字 值 代替 。 插 入 符 (~) 被 
CHAR MAX 代替 。 

我 引入 了 少数 几 个 附加 的 串 来 指定 类 别 re TIE 的 信息 。( 参 考 图 6-6 
定义 的 类 型 Tinfo.) 其 中 每 个 串 都 被 分 为 儿 个 域 。 我 想 不 出 任何 字符 可 以 
当 作 一 个 通用 的 域 界定 符 使 用 ， 所 以 我 采用 通常 的 做 法 : 串 的 第 一 个 字符 界 
定 第 一 个 域 的 开始 。 该 字符 也 界定 每 一 个 子 域 的 开始 。 这 样 选择 的 字符 不 会 
和 域 中 的 任何 字符 冲突 。 

作为 一 个 例子 ，am_pm 实体 详细 说 明了 <time.h> 中 声明 的 函数 strft- 
ime 对 于 AMPM 指示 符 打 印 的 内 容 。 这 个 串 的 常用 定义 是 ，AM: PM。 冒 号 界 
定 了 每 一 个 域 的 开始 。 
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"TIMEZONE" 
hi we Ae 


下 面 是 Lc TIME 类 别 的 实体 名 和 对 英语 国家 来 说 某 些 合理 的 串 值 。 它 们 
大 部 分 都 代表 它们 自己 的 含义 : 


am pm : AM: PM 


days : Sun: Sunday: Mon: Monday: Tue: Tuesday \ 
Wed:Wednesday : Thu: Thursday: Fri :Friday:Sat:Saturday 

dst rules :032402:102702 

time formats *"|%b %D %H:%M:%S BY|%b $D BY |SH:SM:%S" 

months :Jan: January : Feb: February :Mar :March\ 


Apr :April:May:May:Jun:June\ 

Jul :July:Aug:August : Sep: September \ 

Oct : October :Nov :November : Dec : December 
time zone : EST: EDT: +0300 


注意 ， 可 以 使 用 反 斜 线 来 使 一 行 延 续 。 包 括 所 有 延续 的 内 容 ， 一 行 最 多 可 以 
容纳 255 个 字符 。 


字符 串 time formats 指定 了 strftime 生成 区 域 设置 特有 的 日 期 和 时 
间 Cso), AA (%x) LÆRTE (Sc) 所 使 用 的 格式 。 我 会 在 第 15 章 中 进 一 
步 讨论 这 些 函 数 。 

time zone 的 第 三 个 域 对 UTC 格林尼治 平时 ) 的 分 钟 而 不 是 小 时 进 
行 计 数 。 这 就 允许 世界 上 各 个 时 区 跟 UTC 之 间 相差 的 时 间 不 是 整数 个 小 时 。 
如 果 这 个 串 为 空 ， 那 么 时 间 函 数 就 从 环境 变量 "TIMEZONE" 中 寻找 一 个 代 圭 
字符 串 。( 可 以 为 ast_rules 添加 一 个 相似 的 代 蔡 者 。) 如 果 也 找 不 到 这 个 环 
境 变量 ， 那 么 函数 就 会 去 寻找 一 个 使 用 更 广泛 的 环境 变量 "Tz"。 那 个 串 具 有 
ESTOSEDT 这 样 的 形式 ， 这 里 中 间 的 数字 记录 UTC 西部 的 小 时 数 。 


串 ast_rules 其 至 更 夸张 。 它 使 用 下 面 两 种 一 般 格式 中 的 一 种 : 


(YYYY) MMDDHH+W 
(YYYY) MMDDHH-W 


这 里 ， 圆 括号 中 的 YYYY 是 年 ，MM 是 月 ，DD 是 这 个 月 中 的 第 几 天 ,mw 是 
指 星期 几 ，HH 24 小 时 制 的 天 中 第 几 小 时 。 区 提前 到 讨论 中 年 份 的 日 期 
MMDD 当前 或 者 之 后 的 下 一 个 星期 中 的 这 一 天 ，-W 倒 退 到 指定 日 期 之 前 的 上 
一 个 星期 中 的 这 一 天 。 用 来 指定 年 、 小 时 和 星期 的 域 可 以 省 略 。 


上 面 的 那个 简单 的 例子 要 求 夏令 时 从 3 月 24 日 (MMDD=0324) 02:00 
(HH=02) 开始 ， 到 10 月 27 日 相同 的 时 间 结 束 。 为 了 选择 1990 年 之 后 每 年 的 
3 月 和 10 月 的 最 后 一 个 星期 天 ， 可 以 这 样 写 : (1990)040102-0:100102-0, 
(在 这 个 规则 集 下 ，1990 年 以 前 的 年 份 不 使 用 夏令 时 。) 

在 南半球 ， 一 年 刚 开始 就 处 于 夏令 时 中 。 通 过 再 添加 第 三 个 反 转 的 域 ， 
像 :0101: 030202 :100202 这 样 ， 就 能 体会 到 其 中 的 差别 了 。 也 可 以 编写 任 
意 数 目的 倒退 时 间 的 年 份 规则 。 用 一 个 起 始 年 份 (YYYY) 来 限制 每 一 个 集合 
中 的 第 一 个 规则 ， 来 使 规则 生效 。 如 果 你 愿意 ， 就 可 以 获得 一 个 特定 的 州 或 
者 地 区 中 由 法 律 控 制 的 夏令 时 的 全 部 历史 。 
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ee 


«ctype.h» 中 声明 的 所 有 函数 都 是 围绕 着 转换 表 组 织 的 。( 参 考 第 2 BE) 
每 一 个 表 都 是 一 个 具有 257 个 short 类 型 的 元 素 的 数组 ， 这 个 数组 的 下 标 在 
[-1,255] 范围 内 。 在 区 域 设置 文件 中 ， 下 标 为 -1 的 元 素 的 内 容 是 不 能 改变 
的 ， 它 定义 了 <stdio.h> 中 定义 的 宏 BOF 的 值 。 这 些 表 的 实体 名 字 是 ; 

ctype 


tolower 
toupper 


可 以 对 这 些 表 进行 初始 化 ， 一 次 初始 化 一 个 元 素 或 者 一 个 子 集 。 例 如 ， 
下 面 是 使 用 ASCII 字符 和 瑞典 语 的 'A' 对 tolower 表 进行 的 完整 说 明 : 


tolower[0 : 255] Sa 
tolower['A' : 'z'] $$ + 'a' - 'A' 
tolower['À' ] ‘at 


其 中 特殊 项 $8 是 指 子 集中 每 一 个 元 素 的 索引 值 。( 可 以 把 这 个 项 读 做 “ 它 
TEBEJL".) 特殊 项 $$ 是 指 表 元 素 的 以 前 的 内 容 的 值 。( 读 做 “ 它 的 值 是 什 
么 ”)。 注 意 可 以 用 一 个 简单 〈 单 字符 ) 的 字符 常量 来 指定 它 的 编码 值 ， 并 且 
可 以 对 一 系列 项 进行 加 减 操作 。 当 然 ， 前 面 的 两 行 是 可 选 的 。 可 以 从 "ct 区 
域 设 置 那里 继承 而 得 到 它们 。 | 


就 像 本 节 前 面 所 讨论 的 那样 ， 这 个 实现 中 有 几 对 函数 使 用 状态 表 来 定义 
它们 的 行为 。 对 下 面 每 个 实体 名 最 多 可 以 指定 16 个 状态 表 。 


collate 
mbtowc 
wctomb 


我 会 结合 使 用 这 些 表 的 函数 ， 更 加 详细 的 讲解 它们 。 现 在 ， 我 只 给 出 一 
个 简单 的 例子 。 它 显示 了 怎样 为 文件 xstate.c〈 参 考 图 6-11) 中 的 状态 表 编 
写 规 格 说 明 。 它 让 <stalib.h> 中 声明 的 函数 mbtowc 和 mbstowcs 实现 了 多 
字 节 字符 和 宽 字 节 字符 之 间 一 到 一 的 映射 


mb cur max 1 
mbtowc[0, 0:$#] $8 $F $I $0 $0 


第 一 行 给 出 了 <stdlib.h> 中 定义 的 宏 MB CUR MAX 的 值 为 1。 多 字 节 序列 要 
求 不 超过 一 个 字符 。 第 二 行 把 mbtowc 和 mbstowes 的 状态 表 的 所 有 元 素 定义 
为 零 。 它 告诉 函数 : 

C) 把 翻译 的 值 加 到 累加 值 ($F) 中 ; 

O 让 输入 编码 和 它 本 身 相 对 应 ($0); 

C) 使 用 输入 (ST); 

DO 把 累加 值 作为 输出 ($0) 写 出 。 


后 继 的 状态 是 状态 零 ($0) 。 在 这 种 情况 下 ， 当 一 个 零 输 入 编码 生成 一 个 零 宽 
字 节 字符 时 ， 翻 译 就 结束 了 。 
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表达 式 那 就 是 可 以 在 一 个 区 域 设置 中 指定 的 实体 的 列表 。 现 在 你 就 能 理解 为 什 
么 某 些 奇怪 的 项 会 出 现在 表达 式 中 。 一 个 表达 式 本 身 就 是 一 个 简单 地 将 项 加 
在 一 起 而 构成 的 序列 ， 上 面 的 最 后 一 个 例子 说 明了 可 以 通过 简单 地 把 一 个 项 
写 到 男 一 个 后 面 来 把 它 添加 进去 。 在 一 个 项 前 面 添 加 一 个 加 号 也 是 可 以 接受 
的 ， 它 只 是 提高 了 表达 式 的 可 读 性 。 
项 可 以 编写 很 多 不 同 的 项 。 


D 十 进 制 、 八 进 制 和 十 六 进 制 数 遵守 C 常量 的 通用 规则 。 序 列 10. 012 
和 Oxa 都 表示 了 十 进 制 的 值 10. 

D 一 个 项 前 的 加 号 不 改变 它 的 值 ， 一 个 减 号 使 它 变 为 负 值 。 

口 一 个 字符 周围 的 单 引 号 表示 该 字符 的 值 ， 就 像 C 源 文件 中 的 字符 常 
量 一 样 。( 没 有 转 义 序列 ， 尽 管 如 此 ， 像 '\012' 这 样 也 是 允许 的 。) 

D 一 个 大 写字 母 的 值 是 SET 最 后 一 次 赋予 它 的 值 。 所 有 这 样 的 变量 在 程 
序 启动 的 时 候 都 设置 为 零 。 


$x 项 除了 这 些 项 ， 以 一 个 美元 符号 开头 的 双 字 符 名 字 都 有 特殊 的 含义 ， 就 像 
下 面 列 出 来 的 那样 。 下 面 就 是 用 一 个 美元 符号 说 明 的 特殊 项 。 


D $$ 一 一 一 个 表 元 素 的 当前 内 容 。 

O $8 一 一 一 个 表 元 素 的 索引 。$$ 和 se 如 果 在 一 个 表达 式 中 出 现 的 话 ， 
一 定 要 放 在 其 他 的 项 之 前 。 

O $^ 一 一 宏 CHAR_MAX 的 值 。 

$#—— UCHAR, MAX 的 值 。 

O [$a $b $f $n $r $t $v]O— 字 符 转 义 序列 的 值 ， 按 顺序 依次 是 
[ab NM’ An r MW Merl, 

O [$A $C $D $H $L $M $P $S $U $W]— 表 ctype 中 使 用 的 字符 分 
类 位 ， 它 们 依次 说 明了 : 额外 的 字母 、 额 外 的 控制 字符 、 数 字 、 十 六 
进 制 数字 、 小 写字 母 、 运 动 控 制 字 符 、 标 点 符号 、 空 白字 符 、 大 写字 
母 和 额外 的 空白 字符 。( 参 考 2.4 节 对 相关 的 宏 的 定义 。) 

C) [$0 $1 $2 $3 $4 $5 $6 $7] 一 一 一 个 状态 表 元 素 中 状态 0 到 7 的 
后 继 状 态 。( 对 后 继 状 态 8 到 15 不 提供 符号 。 对 状态 8， 可 以 写作 
$7+$1， 依 次 类 推 。) 

D [SF $I $0 $R] 一 一 状态 表 元 素 中 使 用 的 命令 位 。 这 些 项 按照 顺序 说 
明了 : 把 翻译 值 加 到 累加 值 中 ， 使 用 输入 ， 产 生 输 出 和 累加 值 中 的 翻 
转 字 节 。( 参 考 图 6-5 的 文件 xstate: 中 相关 宏 的 定义 。) 


通过 这 些 特 殊 的 项 ， 就 可 以 在 区 域 设置 文件 中 编写 表达 式 ， 而 不 依赖 于 实现 
指定 的 编码 值 。 


u 
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<locale.h> 


n USA" 


区 域 设置 


BAX Getloc 
的 二 次 访问 


我 用 一 个 完整 的 区 域 设置 的 例子 来 结束 这 一 部 分 。 下 面 是 "USA" 区 域 设 
E, EX struct lconv 中 的 所 有 的 域 都 赋 了 合理 的 值 。 对 "CU 区 域 设置 中 
的 排列 顺序 和 多 字 节 编码 没有 作 任 何 修改 ，. 


LOCALE USA 
currency symbol "S$" 
decimal point "n 
grouping "3" 
int curr symbol "USD" 
mon decimal point ' 
mon grouping "3" 


mon_thousands_sep , 
negative sign moe 
positive_sign 
thousands_sep 
frac_digits 
int_frac_digits 
n_cs_precedes 

n sep by space 
n sign posn 

D cs precedes 

p sep by space 
p sign posn 
LOCALE 


最 后 一 行 界定 了 区 域 设置 的 结束 。 只 有 在 区 域 设置 文件 中 最 后 一 个 区 域 设 置 
的 结尾 才 和 需要 这 样 的 一 行 (但 是 它 总 是 允许 的 )。 为 了 改进 检查 体制 ， 如 果 
一 个 区 域 设 置 的 中 间 部 分 出 现 了 文件 结束 符 ， 那 些 读 和 人 区域 设置 文件 的 函数 
就 会 报告 一 个 错误 。 

现在 就 可 以 理解 实现 <locale.h> 的 剩 下 的 函数 了 。 还 记得 吗 ? _Get- 
loc (图 6-8) 首先 尝试 在 内 存 中 找到 一 个 区 域 设 置 。 如 果 失 败 了 ， 它 就 会 尝 
试 打 开 区 域 设 置 文件 ,并 从 中 扫描 到 需要 的 区 域 设 置 的 起 始 位 置 。 它 只 查找 
区 域 设 置 文件 中 以 关键 字 LOCALE 开头 的 行 。_Getloc 调用 _Readloc 来 读 取 
每 一 行 并 且 识 别 它 的 关键 字 。 

如 果 _Getloc 找到 这 个 关键 字 后 面 跟着 它 要 找 的 名 字 的 所 在 行 ， 这 个 函 
数 就 为 新 的 区 域 设置 分 配 空间 。 它 首先 复制 _Clocale 的 内 容 ， 然 后 改变 为 
MOAT. MM _Makeloc 为 区 域 设 置 读 取 剩 下 的 信息 ， 并 且 修 改 相 应 的 存 
储 区 域 。 如 果 _Makeloc 报告 成 功 ，_Getloc 就 把 新 的 区 域 设置 添加 到 起 始 
位 置 为 Clocale._Next 的 列表 上 。 如 果 Makeloc REAM, _Getloc 向 标 
准 错误 流 输出 一 条 错误 信息 ， 放 弃 所 有 分 配 的 空间 ， 并 且 报 告 它 不 能 找到 该 
区 域 设置 。 错 误 信息 中 的 一 部 分 是 导致 失败 的 区 域 设 置 文件 中 的 那 一 行 。 


作为 一 个 规则 ， 库 函数 输出 这 样 的 错误 信息 不 是 很 好 的 做 法 。 它 们 抢占 
了 程序 员 决 定 怎 样 最 好 地 从 一 个 错误 中 恢复 的 权利 。 然 而 我 发 现 ， 在 这 种 情 
况 下 这 种 信息 是 非常 有 价值 的 。 如 果 setlocale 只 读 取 一 个 畸形 的 区 域 设置 
的 一 部 分 或 者 隐秘 地 拒绝 读 取 ， 那 么 该 区 域 设置 就 很 难 调试 。 库 已 经 纵容 了 
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REE KA ND 


函数 


Æ 6-12 
xreadloc.c 


一 个 涉及 打开 和 读 取 文 件 的 复杂 操作 ， 而 且 还 可 能 重复 地 执行 一 所 有 的 都 
是 为 了 关照 程序 员 ， 让 它 看 起 来 像 一 个 简单 的 函数 调用 。 从 这 个 角度 看 ， 输 
出 到 标准 错误 流 不 是 一 个 主要 的 附加 物 。( 在 某 些 环 境 下 ， 可 能 仍然 需要 选 
择 省 略 输 出 。) 


图 6-12 显示 了 文件 xreadloc.c。 它 定义 了 函数 _Readloc， 这 个 函数 
读 取 区 域 设置 文件 ， 一 次 读 取 一 行 。 调 用 者 提供 一 个 MAXLIN 长 度 的 buf 组 
冲 区 来 放 这 一 行内 容 。( 头 文件 "xlocale.h" 把 宏 MAXLIN 定义 为 256。) 这 
就 是 以 反 斜 线 结尾 的 一 行 和 下 一 行 连接 起 来 的 地 方 ， 也 是 关键 字 被 分 析 ， 识 
别 ， 并 且 从 每 一 行 的 开头 去 掉 的 地 方 。 


_Readloc 使 用 表达 式 (n-strspn(s,kc)) 来 确定 输入 一 行内 容 中 的 关键 
字 的 长 度 。 这 个 表达 式 将 字符 串 kc 中 从 s 处 开始 的 最 长 的 字符 序列 的 长 度 


/* _Readloc function */ 
# include <stdio.h> 

# include <string.h> 

# include "xlocale.h" 


/* static data */ 
static const char kc[] = /* keyword chars */ 
* abcdefghijklmnoparstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"; 
_Locitem * Readloc (FILE *lf, char *buf, const char **pg) 
{ /* get a line from locale file */ 
for (i ; ) 
{ /* loop until EOF or full line */ 
size t n; 


for (buf[0] = ' ', n= 1; ; n--2) 
if (fgets(buf + n, MAXLIN - n, if) == NULL 
II buf[(n += strlen(buf + n)) - 1] != '\n') 
return (NULL); /* EOF or line too long */ 
else if (n <= 1 || bufl[n - 2] t= 'NV?) 
break ; /* continue only if ends in \ */ 
buf [n - 1] = "NO"; /* overwrite newline */ 
{ /* look for keyword on line */ 
const char *s = _Skip(buf); 


_Locitem *q; 


if (0 < (n = strspn(s, kc))) 


for (q =  Loctab; q-> Name; ++q) 
if (strncmp(q-» Name, s, n) == 0 
&& strlen (q-> Name) == n) 
{ /* found a match */ 
*ps = Skipís + n - 1); 


return (q); 

} 
return (NULL); /* unknown or missing keyword */ 
} 
} 
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第 6 章 


<locale.h> 


类 型 


_Locitem 


数据 对 象 


. Loctab 


函数 


_Freeloc 


存储 在 n 中 。 我 没有 使 用 <ctype.h> 中 像 isalpha 这 样 的 字符 分 类 函数 ， 因 
为 它们 会 随 着 区 域 设置 不 同 而 改变 。 


_Readloc 在 *ps 处 存储 了 一 个 指针 ， 该 指针 指向 关键 字 后 面 或 者 任何 
空白 后 面 的 那 行 的 第 一 个 字符 。 该 函数 也 返回 一 个 指针 ， 该 指针 指向 一 个 
包含 它 识 别 的 关键 字 信息 的 表 项 。 头 文件 "xlocale.c" 把 类 型 rcode 和 
_Locitem 定义 为 : 


enum Lcode ( 
L GSTRING, L NAME, L NOTE, L SET, 
L STATE, L STRING, L TABLE, L VALUE 
E 
typedef struct ( 
const char * Name; 
size t Offset; 
enum ,Lcode Code; 
) Locitem; 


(标量 类 型 size_t 是 操作 符 sizeof 产生 的 整数 类 型 。 有 几 个 标准 头 文件 都 定 
义 了 这 个 类 型 。 我 会 在 第 11 章 详细 地 讨论 它 。) 成 员 Name 指向 关键 字 的 名 字 。 
Offset 将 偏 移 量 保存 到 和 关键 字 ORARE) 对 应 的 成 员 的 结构 Linfo 
中 。_Coge 用 来 保存 一 个 描述 Loci tem 的 每 一 个 实例 的 特征 的 枚 举 值 。 


_Readloc 对 数据 对 象 _Loctab 和 数组 _Locitem 进行 扫描 ， 以 寻找 和 区 
域 设置 文件 中 每 一 行 的 关键 字 匹 配 的 入 口 。 图 6-13 显示 了 文件 xloctab.c, 
它 定 义 了 _Loctab。 该 文件 使 用 <stddef.h> 中 定义 的 宏 offsetof 来 确定 和 
结构 _Linfo 的 偏 移 量 。 这 里 我 使 用 宏 OFF 来 缩短 这 个 C 源 文件 中 的 文本 行 。 


还 有 一 个 函数 使 用 了 _Loctab。 图 6-14 显示 了 文件 xfreeloc.c。 它 定 
MT PAR _Freeloc。 如 果 Makeloc 在 读 取 区 域 设置 文件 时 过 到 了 一 个 无 效 
行 ， 它 就 回来 向 Getloc 报告 失败 。_Getloc 函数 就 调用 _Freeloc 来 释放 
为 新 的 区 域 设置 分 配 的 所 有 空间 (包括 它 的 名 字 )， 然 后 释放 为 新 的 区 域 设 
置 分 配 的 _Linfo 数据 对 象 。( 放 弃 这 样 的 空间 可 能 也 是 可 以 接受 的 一 一 要 求 
一 个 有 缺陷 的 区 域 设 置 很 少 出 现 一 但 是 收回 不 再 使 用 的 堆 空 间 会 变 得 更 加 
整洁 。) _Freeloc 扫描 _Loectab， 寻 找 那些 与 Linfo 的 成 员 相 对 应 的 元 素 ， 
这 些 成 员 可 以 通过 在 区 域 设置 文件 中 写 人 文本 行 而 被 修改 。 对 Loctab 的 每 
一 个 这 样 的 元 素 ，_Freeloc 确定 是 否 为 新 的 区 域 设置 分 配 了 存储 空间 。 实 现 
这 些 要 花费 点 精力 。 


记 住 ， 每 一 个 新 的 区 域 设置 开始 都 是 "c" 区 域 设 置 的 一 个 副本 。_Make- 
loc 只 有 当 一 个 区 域 设 置 文 件 行 需要 改变 的 时 候 才 分 配 一 个 新 的 表 或 者 串 。 
请 求 这 样 的 一 个 改变 ， 然 后 _Makeloc 对 新 的 Linfo 数据 对 象 的 相关 的 指针 
成 员 和 _clocale 进行 比较 。 如 果 这 些 指针 相同 ，_Makeloc 就 知道 分 配 一 个 
新 的 版 本 。 改 变 也 适用 于 新 的 版 本 ， 而 把 "Cc" 区 域 设 置 的 数据 放 到 一 边 。 如 
果 指 针 不 同 ，_Makeloc 就 会 假设 它 已 经 为 这 个 新 的 区 域 设置 分 配 了 一 个 新 的 
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版 本 。 新 版 本 中 的 改动 会 逐渐 增多 。 


-Freeloc 执行 相似 的 测试 。 如 果 它 遇 到 一 个 指向 串 或 者 表 的 指针 ， 且 该 
指针 与 Clocale 中 相对 应 的 指针 匹配 ， 那 么 该 指针 保持 不 变 。 如 果 它 遇 到 
一 个 指针 ， 且 该 指针 在 新 的 区 域 设 置 和 Clocale 之 间 不 同 ， 那 么 它 就 释放 
新 的 存储 空间 。 
图 6-13 /* _Loctab data object */ 


xloctab.c finclude <stddef.h> 
#include "xlocale.h" 


/* macros */ 


#tdefine OFF (member) offsetof( Linfo, member) 
. /* static data */ 
_Locitem _Loctab[] = I /* locale file info */ 


"LOCALE", OFF( Name), L NAME, 
"NOTE", 0, L NOTE, 
"SET", 0, L SET, 
/* controlled by LC COLLATE */ 
"collate", OFF( Costate. Tab), L STATE, 
/* controlled by LC CTYPE */ 
"ctype" OFF( Ctype), L TABLE, 
"tolower", OFF( Tolower), L TABLE, 
"toupper", OFF( Toupper), L TABLE, 
"mb cur max", OFF( Mbcurmax), L VALUE, 
"mbtowc", OFF( Mbstate. Tab), L STATE, 
"wctomb", OFF( Wcstate. Tab), L, STATE, 
/* controlled by LC MONETARY */ 
"currency symbol", OFF( Lc.currency symbol), L STRING, 
"int curr symbol", OFF( Lc.int curr symbol), L STRING, 
"mon decimal point", OFF( Lc.mon decimal point), L STRING, 
"mon, grouping", OFF(. Lc.mon grouping), L GSTRING, 
"mon thousands sep", OFF( Lc.mon thousands sep), L STRING, 
"negative sign", OFF( Lc.negative sign), L STRING, 
"positive sign", OFF( Lc.positive sign), L STRING, 
"frac digits" OFF( Lc.frac digits), L VALUE, 
"int frac digits" OFF( Lc.int frac digits), L VALUE, 
"n cs precedes" OFF( Lc.n cs precedes), L VALUE, 
"n sep by space", OFF( Lc.n sep by space), L VALUE, 
"n sign posn", OFF( Lc.n sign posn), L VALUE, 
"p cs precedes" OFF( Lc.p, cs precedes), L VALUE, 
"p sep by space", OFF( Lc.p sep by space), L, VALUE, 
"p sign, posn", OFF( Lc.p sign posn), L VALUE, 
/* controlled by LC NUMERIC */ 
"decimal point", OFF( Lc.decimal point), L STRING, 
"grouping", OFF( Lc.grouping), L GSTRING, 
"thousands sep", OFF( Lc.thousands sep), L STRING, 
/* controlled by LC TIME */ 
"am pm", OFF( Times. Ampm), L STRING, 
"days" OFF( Times. Days), L STRING, 
"dst rules", OFF( Times. Isdst), L STRING, 
"time formats", OFF( Times. Formats), L STRING, 
"months", OFF( Times. Months), L STRING, 
"time zone", OFF( Times. Tzone), L STRING, 
NULL); 
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图 6-14 /* Freeloc function */ 
xfreeloc.c #include "xlocale.h" 


void _Freeloc(_Linfo *p) 


{ /* free all storage */ 
_Locitem *q; 


for (q = _Loctab; q->_Name; ++q) 
switch (q->_Code) 
{ /* free all pointers */ 
case L STATE; 
{ /* free all state entries */ 
int i; 


unsigned short **pt 
= &ADDR(p, q, unsigned short *); 


for (i =  NSTATE; 0 <= --i; ++pt) 
if (*pt && (*pt)[-1] != 0) 
free(*pt); 
) 
break; 


case L TABLE: 
if (NEWADDR(p, q, short *)) 
free(ADDR(p, q, short *) - 1); 
break; ` 
case L GSTRING: 
case L NAME: 
case L STRING: 
if (NEWADDR(p, q, char *)) 
free(ADDR(p, q, char *)); 


) 


_Makeloc 和 Freeloc 都 使 用 两 个 很 复杂 的 宏 来 完成 这 个 工作 。 头 文件 
"xlocale.h" 包含 了 以 下 的 定义 : 


#define ADDR(p, q, ty) (*(ty *)((char *)p + g-> Offset)) 
#define NEWADDR(p, da, ty) \ 
(ADDR (p,q. ty) != ADDR(& Clocale, q, ty)) 


Å ADDR 例如 ， 可 以 编写 ADDR (p,q, char*) 来 构建 一 个 左 值 一 一 一 个 可 以 用 来 访 
问 数据 对 象 的 部 分 或 者 全 部 的 表达 式 。 这 里 ， 数 据 对 象 是 由 P 指向 的 _Linfo 
类 型 的 结构 的 一 个 成 员 。g 指 向 Loctab (_Locitem 类 型 ) 的 一 个 元 素 ， 这 
个 元 素 包 含 了 这 个 成 员 的 偏 移 量 。 这 种 情况 下 ， 这 个 成 员 为 指向 char 类 型 数 
据 的 指针 。 


宏 NEWADDR 例如 ， 可 以 写 NEWADDR(p, q, char *) 来 测试 一 个 成 员 从 _Clocale 复 
制 出 来 以 后 是 否 发 生 了 改变 。 参 数 和 宏 ADDR 的 相同 。 


释放 状态 表 然而 ， 这 种 机 制 为 状态 表 打 破 了 。 每 一 个 状态 表 都 包含 了 指向 可 以 在 
区 域 设置 文件 中 指定 的 表 的 _NSTATE 个 指针 。( 头 文件 "xstate.h" 中 把 宏 
_NSTATE 定义 为 16。) 正如 它们 所 表示 的 ， 这 些 宏 对 每 一 个 需要 条 件 释放 的 
表 都 需要 _Loctab 中 的 一 个 元 素 。 我 不 想 向 Loctab 灌输 很 多 虚拟 的 项 来 考 


函数 


_Makeloc 
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iy Freeloc 的 能 力 。 同 样 ， 我 也 不 想 让 宏 ADDR 和 NEWADDR 更 加 复杂 。 


因此 ， 我 决定 对 释放 状态 表 使 用 一 种 不 同 的 机 制 。 为 了 分 享 编码 ， 我 已 
经 将 状态 表 构 造 得 看 起 来 很 像 <ctype.h> 中 声明 的 函数 使 用 的 字符 转换 表 。 
那 就 是 说 ， 每 一 个 表 都 有 一 个 下 标 为 -1 (和 <stdio.h> 中 定义 的 宏 EOF 的 
值 相 对 应 的 元 素 。 那 些 使 用 状态 表 的 函数 中 没有 一 个 知道 或 者 关心 这 个 额 
外 的 元 素 。 所 以 ， 我 把 它 当 作 一 个 表示 状态 表 是 否 已 经 分 配 的 标志 。 


"c" 区 域 设 置 中 的 所 有 函数 共享 的 原始 的 状态 表 在 文件 xstate.c 参考 
图 6-11〉 中 定义 。 它 的 下 标 为 -1 的 元 素 值 为 零 。 如 果 Makeloc 分 配 一 个 新 
的 状态 表 ， 它 就 在 下 标 为 -1 的 元 素 中 存储 一 个 非 零 值 。 这 就 是 _Freeloc 知 
道 是 否 要 释放 一 个 状态 表 的 方式 。 


图 6-15 显示 了 文件 xmakeloc.c。 它 定义 了 函数 _Makeloc (已 经 详细 
讨论 了 这 个 函数 )。 虽 然 _Makeloc 很 大 ， 但 它 只 是 一 个 处 理 区 域 设置 文件 中 
的 文本 行 的 简单 的 while 循环 。 循环 的 主体 部 分 是 处 理 不 同 种 类 的 文本 行 的 
switch 语句 。 这 些 代 码 很 简单 ， 但 是 页 长 而 又 紧凑 。 


还 没有 遇 到 过 的 一 个 宏 是 TABSIZ。 头 文件 "xlocale.h" 包含 了 下 面 的 
定义 : 


#define TABSIZ ((UCHAR MAX + 2) * sizeof (short)) 


这 是 一 种 简单 的 、 书 写 各 种 各 样 的 表 的 大 小 的 可 移植 的 方式 ， 这 些 表 的 大 小 
以 字 节 为 单位 ， 可 以 在 一 个 区 域 设置 文件 中 修改 它们 。 


_Makeloc 尽 可 能 多 地 调用 内 部 函数 getval 来 对 表达 式 进 行 分 析 和 求 
值 。 这 就 有 助 于 在 一 个 区 域 设置 文件 行 中 写 和 人 表达 式 时 保持 规则 的 统一 。 
( 表 元 素 的 表达 式 是 一 个 例外 一 一 只 有 它们 接受 特殊 项 Se A$$.) 反 过 来 ， 
getval 重复 地 调用 _Locterm 来 计算 一 个 项 的 序列 的 和 。 


图 6-16 显示 了 文件 xlocterm.c， 这 个 文件 定义 了 函数 _Locterm。 这 就 
是 各 个 项 被 分 析 和 求 值 的 地 方 。 为 了 求 八 进 制 、 十 进 制 和 十 六 进 制 的 数值 ， 
_Locterm 调 用 <stdlib.h> 中 声明 的 strtol。 注 意 这 个 函数 是 如 何 更 新 字 
SHEE s 来 指向 它 刚 刚 分 析 和 转换 的 数字 。._Locterm 的 代码 被 极 大 地 压缩 了 。 


文件 xlocterm.c 也 定义 了 国 数 Locvar, WA Makeloc 用 SET 关键 字 
处 理 一 个 区 域 设置 文件 文本 行 的 时 候 才 调用 该 函数 。_Locvar 也 很 小 ， 它 可 
以 简单 地 用 内 联 代码 来 取代 。 


然而 ， 我 把 _Locvar 放 到 xlocterm.c 中 却 有 一 个 很 好 的 理由 。 它 和 
_Locterm 共享 .了 访问 两 个 数组 uppers 和 vars 的 需求 。 这 就 分 别 给 出 了 可 
以 在 区 域 设置 文件 中 用 SET 关键 字 修改 的 项 的 名 字 和 值 。 通 过 把 这 两 个 函数 
放 到 同一 个 文件 中 ， 这 些 数组 可 以 对 那个 文件 保持 私有 ， 就 像 它们 的 实现 细 
节 可 以 做 的 那样 。 
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6-15 
xmakeloc.c 


|| (s » getval( Skip(s), &lo)) -- NULL) 


<locale.h> 


/* _Makeloc function */ 
#include <string.h> 
#include "xlocale.h" 


static const char *getval(const char *s, unsigned short *ans) 


{ /* accumulate terms */ 
unsigned short val; 


if (! Locterm(&s, ans)) 
return (NULL); 

while ( Locterm(&s, &val)) 
*ans += val; 

return (s); 


) 


int _Makeloc (FILE *1f, char *buf, Linfo *p) 
{ /* construct locale from text file */ 
const char *s; 
char Seil: 
_Locitem *q; 
unsigned short val; 


static const char gmap[] = "0123456789abcdef^"; 
while ((q = Readloc(lf, buf, &s)) !- NULL) 
switch (q->_Code) 
{ /* process a line */ 
case L_GSTRING: /* alter a grouping string */ 
case L_STRING: /* alter a normal string */ 


if (NEWADDR(p, q, char *)) 
free(ADDR(p, q, char *)); 


if (s[0] == '"' 
&& (sl = strrchr(s + 1, '"')) != NULL 
&& * Skip(sl) == '\0') 
*sl = 'NO', ++8; 
if ((sl = (char *)malloc(strlen(s) + 1)) == NULL) 


return (0); 
ADDR(p, q, char *) = strepy(sl, s): 
if (q->_Code == L_GSTRING) 


for (; *sl; ++s1) 
if ((s = strchr(gmap, *s1)) !- NULL) 
Sal = *g == '^' ? CHAR MAX : s-gmap; 
break; 
case L, TABLE: /* alter a translation table */ 
case L STATE: /* alter a state table */ 
{ /* process tab[#,lo:hi] $x expr */ 
int inc = 0; 


unsigned short hi, lo, stno, *usp, **uspp; 


if (xs !- '[' 
I| (s = getval( Skip(s), &stno)) == NULL) 
return (0); 

if (xs != ',') 
lo = stno, stno = 0; 

else if (q->_Code != L_STATE || _NSTATE <= stno 


图 6-15 
( 续 ) 
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return (0); 


lo = (unsigned char)lo; 
if (*s != ':') 
hi = lo; 
else if ((s = getval(_Skip(s), &hi)) == NULL) 
return (0); 
else 
hi = (unsigned char) hi; 
if (xs t= ']') 
return (0); 
for (s = _Skip(s); s[0] == '$'; s = _Skip(s + 1)) 
if (s[1] == '@' && (inc & 1) == 0) 
inc |= 1; 
else if (sí1] == '$' && (inc & 2) == 0) 
inc | = 2; 
else 
break; 
if ((s = getval(s, &val)) == NULL || *s != '\0') 


return (0); 
uspp = &ADDR(p, q, unsigned short *) + stno; 


if (q-» Code -- L, TABLE) 
usp - NEWADDR(p, q, short *) ? *uspp : NULL; 
else 
usp = (*uspp) [-1] ? *uspp : NULL; 
if (usp -- NULL) 
( /* setup a new table */ 
if ((usp = (unsigned short *)malloc(TABSIZ)) 
== NULL) 
return (0): 
usp[0] = EOF; /* allocation flag or EOF */ 


memepy(++usp, ADDR(p, q, short zi, 
TABSIZ - sizeof (short)); 
*uspp - usp; 
) 
for (; lo <= hi; ++10) 
usp[lo] = val + (inc & 1 ? lo: 0) 
+ (inc & 2 ? usp[lo]) : 0); 


) 
break; 
case L VALUE: /* alter a numeric value * / 
if ((s = getval(s, &val)) == NULL || *s != "N0") 


return (0); 
ADDR(p, q, char) = val; 


break; 
case L SET: /* assign to uppercase variable * / 
if (*(sl = (char *) Skip(s)) == '\0' 
I] (sl = (char *)getval (si, &val)) == NULL 
l| sei != 'NO' ||] | Locvar(*s, val) == 0) 
return (0); 
break; 
case L NAME: /* end happily with next LOCALE */ 
return (1); 
H 
return (0); /* fail on EOF or unknown keyword */ 


) 口 
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图 6-16 


xlocterm.c 


«locale.h» 


/* _Locterm and Locvar functions */ 
#include <ctype.h> 

#include <limits.h> 
#include <string.h> 
#include "xlocale.h" 


/* static data */ 
static const char dollars[] = { /* PLUS $@ and $$ */ 
"^abfnrtv" /* character codes */ 
"01234567" /* state values */ 
"ACDHLMPSUW" /* ctype codes */ 
"ÉFIOR"); /* state commands */ 
Static const unsigned short dolvals[] = ( 
CHAR MAX, '\a', '\b', "NÉI, "NN, "Nr', 'Nt', 'Nv', 
0x000, 0x100, 0x200, 0x300, 0x400, 0x500, 0x600, 0x700, 
XA, BB, DI, XD, LO, CN, PU, SP, UP, XS, 
UCHAR MAX, ST FOLD, ST INPUT, ST OUTPUT, ST ROTATE); 
static const char uppers [] = "ABCDEFGHIJKIMNOPORSTUVWXYZ" ; 
static short vars[sizeof (uppers) - 1] = {0}; 


int _Locvar(char ch, short val) 


{ 


. /* set a $ variable */ 
const char *s = strchr(uppers, ch); 


if 


(s == NULL) 
return (0); 

vars[s - uppers] - val; 
return (1); 


) 


_Locterm(const char **ps, unsigned short *ans) 
{ /* evaluate a term on a locale file line */ 
const char *s = *ps; 

const char *s1; 

int mi; 


for (mi = 0; *s = '+! || *s == '-' ; s = _Skip(s)) 
mi = *g == ' ' ? lmi : mi; 

if (isdigit(s[0])) 
*ans = strtol(s, (char **) Se, 0); 


else if (s[0] == '\'' && s [1] != 'NO' && s[2] == '\'') 
*ans = ((unsigned char *)s) [1], s += 3; 

else if (s[0] && (sl = strchr(uppers, s[0])) !- NULL) 
*ans = vars[sl - uppers], ++s; 

else if (s[0] == 'S' && s[1] 
&& (sl = strchr(dollars, s[1])) != NULL) 
*ans = dolvals[sl - dollars], s += 2; 

else 
return (0); 

if (mi) 
*ans = -*ans; 

*ps = _Skip(s - 1); 


return (1); 


) 


头 文件 


"xlocale.h" 
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最 后 ， 我 将 给 出 内 部 头 文件 "xlocale.h" 的 完整 内 容 。 图 6-17 显示 了 
文件 xlocale.h。 到 现在 再 显示 这 个 文件 就 有 点 平淡 了 。 因 为 在 前 面 的 过 程 
中 你 已 经 看 到 了 所 有 重要 的 部 分 了 。 


事实 上 ， 本 章 出 现 了 大 约 800 行 的 代码 。 对 于 实现 C 标准 库 中 描述 的 仅 
有 的 两 个 函数 和 一 个 标准 头 文件 来 说 ， 这 些 代 码 太 多 了 。 然 而 ， 我 相信 ， 定 
义 新 的 区 域 设置 的 能 力 提 供 了 相当 多 的 承诺 。 如 果 对 代码 的 投入 能 传递 到 那 
些 承 诺 身 上 ， 它 们 的 价值 就 体现 出 来 了 。 


6.5 <locale.h> 的 测试 


图 6-18 显示 了 测试 程序 tlocale.c。 它 主要 关注 «locale.h» 中 的 函数 
的 可 移植 的 行为 。 因 此 ， 对 本 章 中 出 现 的 很 多 代码 它 都 没有 测试 。 要 做 到 这 
一 点 ， 你 需要 转换 到 一 个 新 的 区 域 设 置 ， 例 如 前 面 给 出 的 “Usa?。 然 后 可 以 
打印 附加 函数 _Fmtval 的 结果 来 检验 行为 是 否 按照 预想 的 改变 了 。 


可 以 使 用 tlocale.c 来 测试 标准 C 的 任何 实现 。 它 保证 "C" 区域 设置 满 
E C 标准 的 所 有 要 求 ， 无 论 是 在 区 域 设 置 的 各 种 改变 之 前 还 是 之 后 。 它 还 保 
证 可 以 建立 混合 的 区 域 设置 一 一 至 少 包含 了 "Cc" 区 域 设置 和 本 地 区 域 设置 。 
它 尽力 确定 这 两 个 区 域 设置 是 否 不 同 。 你 会 得 到 这 两 条 信息 之 一 。 这 个 实现 
下 应 该 输出 : 


Native locale same as "C" locale 
SUCCESS testing <locale.h> 
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67 ”习题 


6.1 


6.2 


ISO Standard 4217:1987 (Geneva: International Standards Organization, 1987). 这 
个 标准 对 各 个 国家 的 货币 的 三 字母 编码 进行 了 详细 说 明 。 


编写 表示 意大利 、 荷 兰 、 挪 威 和 瑞士 的 货币 习惯 的 区 域 设置 。 使 用 C 标准 
7.4.2.1 部 分 的 例子 提供 的 信息 OM 6.2 节 )。 


编写 一 个 表示 法 语 的 字符 分 类 习惯 的 区 域 设 置 。 把 小 写字 母 [& àa à c ee 
e ô 可 和 它们 相应 的 大 写字 母 (A AACE Èf ô 0 EISES ctpye、 
tolower 和 toupper 中 。 你 怎样 在 你 的 实现 下 确定 这 些 字 母 的 编码 值 ? 


图 6-17 
xlocale.h 


<locale.h> 


DN internal header */ 
#include <limits.h> 

#include <locale.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include "xstate.h" 

#include "xtinfo.h" 


/* macros for _Getloc and friends */ 
*define ADDR(p, q, ty) (*(ty *)((char *}p + q-> Offset)) 
#define NEWADDR(p, q, ty) \ 
(ADDR(p, q, ty) !- ADDR(& Clocale, q, ty)) 
#define MAXLIN 256 
#define TABSIZ ((UCHAR MAX + 2) * sizeof (short)) 
/* type definitions */ 
typedef const struct ( 
const char * Name; 
size t Offset; 
enum ( 
L GSTRING, L NAME, L NOTE, L SET, 
L STATE, L STRING, L TABLE, L VALUE 
) Code: 
)  Locitem; 
typedef struct  Linfo ( 
const char * Name; /* must be first */ 
struct  Linfo * Next; 
/* controlled by LC COLLATE */ 
_Statab  Costate; 
/* controlled by LC CTYPE */ 
const short * Ctype; 
const short * Tolower; 
const short * Toupper; 
unsigned char | Mbcurmax; 
.Statab  Mbstate; 
.Statab  Wcstate; 
/* controlled by LC MONETARY and LC NUMERIC */ 
Struct lconv Lc; 
/* controlled by LC TIME */ 
 Tinfo Times; 
) Linfo; 
/* declarations */ 
const char * Defloc(void): 
void Freeloc( Linfo *); 
_Linfo * Getloc(const char *, const char *); 


int _Locterm(const char **, unsigned short *); 

int _Locvar(char, short); 

int _Makeloc(FILE *, char *,  Linfo *); 

_Locitem * Readloc(FILE *, char *, const char **); 

_Linfo * Setloc(int, _Linfo zi: 

const char * Skip(const char *); 

extern  Linfo | Clocale; 

extern Locitem _Loctab[]; D 
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Æ 6-18 
tlocale.c 


/* test 

finclude 
include 
#include 
#include 
#include 


static v 
( 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
asse 
} 


int main 
{ 
stat 


stru 
char 


asse 
test 
asse 
asse 
stre 
asse 
asse 
asse 
puts 


asse 
asse 
test 
asse 
asse 
test 
puts 
retu 


} 


locales */ 
<assert .h> 
<limits.h> 
<locale.h> 
<stdio.h> 
<string.h> 


oid testclocale(struct lconv *p) 
/* test properties of "C" locale */ 


rt(strcmpíp-»currency, symbol, "") == 0); 
rt(stremp(p->decimal_point, ".") == 0); 
rt(strcmp(p-»grouping, "") == 0); 
rt(stremp(p->int curr symbol, "") == 0); 
rt(stremp(p->mon_decimal_point, "") == 0); 
rt(stromp(p->mon grouping, "") == 0); 
rt(strcmpí(p-»mon thousands sep, "ni == 0); 
rt(stromp(p-»negative sign,"") == 0); 
rt(strcmp(p-»positive sign,"") == 0); 
rt(strcmpí(p-»thousands sep, "ni == 0); 
rtí(p-»frac digits == CHAR MAX); 
rt(p->int frac digits == CHAR MAX); 
rt(p->n cs, precedes == CHAR MAX); 
rt(p-»n sep by space == CHAR MAX); 
rtí(p-»n sign posn == CHAR MAX); 
rt(p-»p cs precedes == CHAR MAX); 
rtí(p-»p sep by space == CHAR MAX); 
rt(p->p sign posn == CHAR MAX); 
() 

/* test basic properties of locales */ 
ic int cats [] = (LC ALL, LC COLLATE, LC CTYPE, 


LC MONETARY, LC NUMERIC, LC TIME ) ; 


ct lconv *p - NULL; 
buf [32], *s; 
rt((p = localeconv()) != NULL); 
clocale(p); 
rt((s = setlocale(LC ALL, NULL)) ! = NULL); 
rt(strlen(s) < sizeof (buf)); /* OK if longer */ 
py (buf, s); /* but not safe for this program */ 
rt(setlocale(LC_ALL, "") != NULL); 
rt(localeconv() != NULL); 
rt((s = setlocale(LC_MONETARY, "C")) != NULL); 
{stremp(s, "C") ? "Native locale differs from \"C\"" 
"Native locale same as \"C\""); 
rt (setlocale(LC_NUMERIC, "C") !- NULL); 
rt((p = localeconv()) != NULL); 
clocale(p); 
rt(setlocale(LC ALL, buf) != NULL); 
rt((p = localeconv()) != NULL); 
clocale(p); 


("SUCCESS testing <locale.h>"); 
rn (0); 
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<locale.h> 


6.3 


6.4 


6.5 


6.6 


6.7 


修改 测试 程序 tctype.c (图 2-19)， 使 它 首先 转换 为 上 题 中 的 区 域 设置 。 当 
你 运行 它 的 时 候 ， 它 会 显示 你 所 希望 的 内 容 吗 ? 


编写 表示 法 语 的 币值 和 数字 习惯 的 区 域 设置 ， 你 至 少 需要 修改 以 下 几 个 地 
方 : 


mon decimal point decimal point 


mon grouping grouping 
mon thousands sep thousands sep 
negative sign positive sign 


测试 你 的 新 的 区 域 设 置 。( 提 示 : 你 可 以 从 本 章 和 后 面 的 章节 中 的 测试 程序 
AF.) 


[3E 有 很 多 具有 小 数位 的 值 的 表 经 常 以 $ 为 单位 对 小 数 点 右边 的 数字 进行 分 
组 。 例如 : 


+1.00000 00000 00 
-0.16666 66666 67 
+0.00833 33333 33 
-0.00019 84126 98 


fø] struct lconv 中 添加 成 员 frat grouping 和 frat, group sep. Hi E 
的 方式 定义 它们 : 你 可 以 指定 这 个 例子 〈 当 然 也 包括 其 他 的 ) 中 使 用 的 格式 。 
修改 本 章 中 的 代码 ， 包 括 _Fmtval， 来 对 这 些 成 员 正 确 地 进行 初始 化 、 复 制 、 
修改 和 使 用 。C 标准 允许 这 样 的 增加 吗 ? 

[ 难 ] 你 希望 有 一 个 可 以 构建 它 自己 的 区 域 设 置 的 程序 。 不 能 重新 编写 区 域 设 
置 文件 。 你 会 在 <locale.h> 中 添加 什么 函数 来 允许 一 个 程序 迅速 地 命名 、 
构建 和 添加 新 的 区 域 设 置 。 编 写 一 个 用 户 文档 ， 程 序 员 能 用 这 个 文档 来 增加 
区 域 设 置 。 


[ 很 难 ] 实现 你 在 上 题 中 描述 的 功能 。 


7.1 


<math.h> 


背景 知识 


历史 


目标 


编写 出 好 的 数学 函数 是 一 件 很 难 的 事 。 现 在 的 一 个 普遍 现象 是 有 些 程 序 
设计 语言 的 实现 提供 的 数学 函数 存在 严重 的 缺陷 。 它 们 可 能 会 对 具有 明确 定 
义 的 函数 值 的 参数 产生 中 间 值 溢出 ， 或 者 丢失 很 多 位 的 有 效 数字 ， 某 些 情况 
下 还 会 产生 错误 结果 。 


虽然 实现 人 员 有 充足 的 时 间 来 研究 这 些 问题 ， 但 仍然 有 那么 多 的 缺陷 ， 
这 一 点 让 人 奇怪 。 计 算 机 最 早 就 用 于 解决 各 种 工程 或 者 数学 难题 ， 事 实 上 ， 
最 早 的 库 几 乎 完全 由 计算 常用 数学 函数 的 函数 组 成 。20 世纪 50 年 代 出 现 的 
FORTRAN， 就 是 以 它 的 功能 FORmula TRANslation 〈 公 式 转 换 ) 的 缩写 来 命 
名 的 ， 那 些 公 式 是 由 很 多 数学 函数 组 成 的 。 


在 过 去 的 几 十 年 中 ， 实 现 人 员 变 得 越 来 越 老 练 。IEEE 754 浮 点 数 标准 对 
浮 点 算术 的 安全 和 一 致 是 一 个 重要 的 里 程 碑 。( 参 考 第 4 章 中 对 浮 点 数 表示 
和 IEEE 754 标准 的 讨论 。) 但 是 从 另 一 个 角度 来 说 ，IEEE 754 又 加 重 了 实现 
人 员 的 负担 。 因 为 它 引 入 了 渐进 下 溢 ， 对 无 穷 大 和 非 数 的 编码 ， 不 同 的 精度 
要 求 不 同 大 小 的 指数 等 复杂 的 东西 。 所 以 很 多 实现 通常 只 支持 IEEE 754 标准 
的 一 部 分 ， 而 不 是 全 部 。 


我 花 在 编写 和 调试 <nath.h> 中 声明 的 函数 的 时 间 和 这 个 库 中 其 他 所 有 


. 的 函数 加 起 来 的 时 间 差 不 多 ， 这 的 确 让 我 有 点 吃惊 。 在 过 去 的 二 十 多 年 的 时 


间 中 ， 我 对 每 一 个 数学 库 函 数 都 至 少 预先 编写 过 3 MT DAR RT fie AD PU 
该 有 足够 的 时 间 来 避免 错误 的 发 生 ， 我 也 曾 这 样 认为 ， 但 事实 并 非 如 此 。 


我 化 了 这 人 么 长 的 时 间 是 为 了 达到 以 下 几 个 目标 : 

C 数学 库 函 数 应 该 能 在 各 种 常用 的 计算 机 体系 结构 之 间 移 植 。 每 个 函数 
产生 的 结果 都 要 具有 56 位 的 精度 ， 这 会 使 它们 适合 很 多 64 位 double 
表示 的 机 器 一 一 那些 具有 IEEE 754 可 兼容 的 协 处 理 器 的 机 器 (53 位 
精度 )、IBM System/370 系列 (53 ~ 56 位) 和 DEC VAX 系列 (56 
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没有 实现 的 


目标 


<math.h> 


g 


口 


位 )。 

每 一 个 函数 都 应 该 能 接受 定义 域内 的 所 有 参数 值 ( 即 数学 上 定义 的 
参数 值 ?。 对 于 其 他 所 有 的 参数 都 应 该 报告 定义 域 错误 ， 这 种 情况 下 ， 
函数 返回 一 个 表示 非 数字 的 特殊 编码 NaN. 

对 于 一 个 具体 的 值 ， 函 数 应 该 产生 一 个 确定 的 结果 。 对 于 所 有 太 大 
或 者 太 小 而 不 能 表示 的 值 ， 它 应 该 报告 值 域 错误 。 如 果 结 果 的 数值 太 
大 ， 那 么 函数 就 要 返回 一 个 表示 正 无 穷 大 的 特殊 编码 +Inf， 或 者 表示 
负 无穷 大 的 编码 -Inf; 如 果 数 值 太 小 ， 函 数 就 返回 零 。 

对 于 参数 值 NaN、+Inf 和 -Inf， 每 一 个 函数 都 应 该 产生 最 合理 的 结 
果 。 在 一 个 像 IEEE 754 这 样 支持 多 重 NaN 编码 的 实现 下 ， 这 些 函 数 
在 任何 需要 的 地 方 都 要 保留 特殊 的 NaN 编码 。 例 如 ， 如 果 一 个 函数 
只 有 一 个 参数 并 且 那 个 参数 的 值 为 NaN， 那 么 这 个 函数 就 返回 参数 
值 。 

对 任何 可 以 表示 的 结果 ， 每 个 函数 都 应 尽 可 能 地 把 精度 误差 控制 在 两 
位 之 内 。 

不 论 一 个 函数 的 参数 值 或 者 结果 是 什么 ， 它 都 不 应 该 产生 上 溢 、 下 滋 
或 者 除 零 的 情况 。 

每 一 个 函数 一 般 都 用 双 精 度数 ， 而 不 是 浮 点 数 来 表示 中 间 结 果 。 


本 书 的 代码 可 以 说 已 经 达到 了 这 些 目标 ， 因 为 这 些 函 数 从 测试 开始 到 现在 一 
直 经 得 起 考验 。 


下 面 是 一 些 没有 实现 的 目标 。 


口 


这 个 库 不 区 分 +0 和 -0， 而 IEEE 754 就 严格 区 分 零 的 这 两 种 形式 。 
我 上 面 提 到 的 所 有 的 体系 结构 都 可 以 把 0 表示 为 这 两 种 形式 。 但 是 
我 却 不 能 接受 〈 甚 至 是 理解 ) 其 中 的 道理 ， 近 期 就 有 很 多 人 对 IEEE 
754 标准 提出 了 批评 ， 并 对 区 分 零 的 原理 提出 了 质疑 。 在 多 数 情况 
下 ， 如 果 一 定 要 处 理 零 的 符号 ， 这 些 函 数 会 很 难 编写 。 

这 个 库 对 各 种 各 样 的 NaN 没有 做 任何 区 别 。 例 如 ，IEEE 754 算术 就 
区 分 静默 NaN (quiet NaN) 和 信号 NaN (signalling NaN)， 后 者 应 该 
产生 一 个 信号 或 者 引发 一 个 异常 ， 但 这 个 实现 实际 上 把 所 有 的 NaN 
都 作为 静默 NaN 处 理 。 

RA IEEE 754 表示 提供 了 低级 原 语 Cprimitive)。 它 们 恰巧 也 能 天 
DEC VAX 的 浮 点 数 表 示 正 常 地 运行 ,但 是 并 不 能 完全 匹配 。VAX 的 
硬件 不 能 把 像 +Inf 和 -Inf 之 类 的 东西 识别 为 特殊 的 代码 值 ， 这 些 代 
码 会 在 与 它们 进行 运算 的 表达 式 中 消失 。 这 些 原 语 一 定 要 经 过 修改 才 
能 支持 System/370 浮 点 。 


有 限 精度 


有 限 范围 


Cody 
和 waite 
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O 我 没有 在 Systemy370 下 检查 这 些 函数 ， 因 为 那 种 结构 下 的 “摇摆 精 
度 (wobbling precision)” 要 求 特殊 的 处 理 。 虽 然 我 也 大 致 提供 了 这 
种 特殊 的 处 理 ， 但 它 可 能 不 是 十 分 彻底 。 

O 有 些 机 器 的 double 类 型 的 保留 精度 远 少 于 53 位 ， 对 于 这 些 机 器 ， 很 
多 函数 可 能 都 不 是 最 理想 的 。C 标准 允许 double 保留 低 至 10 位 小 数 
的 精度 大 约 31 位 。 对 这 样 的 机 器 ， 应 该 重新 考虑 各 种 数学 函数 
的 近似 值 选 择 。 

D 有 些 机 器 的 精度 多 于 56 位 。 在 这 些 机 器 下 使 用 近似 值 的 函数 几乎 都 
会 出 错 。 因 此 ， 对 这 样 的 机 器 ， 也 必须 考虑 重新 选择 近似 值 。 

D 数学 库 函 数 的 这 个 实现 不 能 很 好 地 支持 基数 不 是 2 或 者 16 的 浮 点 数 
表示 。 例 如 ， 一 个 基数 为 10 的 浮 点 数 算 术 的 实现 ， 就 会 要 求 重 新 设 
计 有 效 值 。 

即使 没有 达到 以 上 目标 ， 这 些 库 函 数 的 实现 仍然 适用 于 各 种 各 样 的 环境 。 
安全 并 且 精 确 地 计算 数学 清 数 要 求 下 面 这 些 特殊 的 编程 风格 : 


D 浮 点 数 表 示 的 有 限 精 度 既 有 利 又 有 次。 近似 值 的 精度 是 有 限 的 。 但 是 
中 间 数 的 计算 精度 也 是 有 限 的 。 而 实际 上 ， 这 样 有 时 会 产生 很 大 的 误 
Fo 

O 浮 点 数 表示 的 有 限 的 范围 也 是 既 有 利 义 有 次。 这 样 可 以 选择 安全 的 数 
据 类 型 来 表示 任意 的 指数 ， 但 又 会 在 中 间 数 的 计算 中 产生 上 溢 或 下 


你 可 以 通过 执行 各 种 各 样 的 半数 值 操作 来 分 解 浮 点 值 。 可 以 把 浮 点 值 分 
为 以 下 独立 的 部 分 : 小 范围 值 的 小 数 、 整 数 指数 和 符号 位 。 这 样 你 就 能 以 更 
快 的 速度 、 更 高 的 精度 和 更 高 的 安全 性 对 各 个 部 分 进行 操作 。 然 后 再 使 用 其 
他 的 半数 字 操 作 把 最 后 的 结果 连 在 一 起 。 


由 William J. Cody, Jr. 和 William Waite 写 的 Software Manual for the 
Elementary Functions 是 一 本 关于 编写 数学 函数 库 的 好 书 。 本 章 中 的 很 多 函 
数 都 使 用 了 Cody 和 Waite 描述 的 算法 和 技术 。 很 多 人 实际 使 用 的 近似 值 都 是 
Cody 和 Waite 特别 为 他 们 的 这 本 书 设计 的 。 我 原 以 为 在 某 些 场合 下 可 以 去 掉 
一 些 他 们 推荐 的 繁琐 的 步 又， 但 事实 证 明 我 是 错 的 。 我 很 庆幸 我 借鉴 了 这 些 
严谨 的 先驱 们 的 成 果 。 

最 后 一 点 ，<math.h> 中 声明 的 很 多 函数 进行 的 测试 是 公共 域 (public 
domain) 的 elefunt (“elementary function” (HE RAO 的 缩写 ) Mik. ix 
些 都 源 于 Cody 和 Waite 精心 设计 的 测试 。 
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<math.h> 


HUGE VAL 


值 域 错 误 


acos 


asin 


7.5 数学 函数 amath.h» 

头 文件 <math.h> 声明 了 一 些 数学 函数 并 定义 了 一 个 宏 。 这 些 函 数 接收 double 类 型 的 
参数 ， 并 返回 一 个 double 类 型 值 中 。 以 后 会 讨论 整数 算术 函数 和 转换 函数 。 

定义 的 宏 是 : 

HUGE_VAL 
它 展开 为 一 个 正 的 double 类 型 的 表达 式 ， 用 float 类 型 不 一 定 能 表达 IU. 

SN: 整数 算术 函数 (7.10.6)、 函 数 atof (7.10.1.1) 和 函数 strtod (7.10.1.4)。 
7.5.1 错误 情况 的 处 理 

这 些 函 数 的 行为 对 输入 参数 的 所 有 可 表示 的 值 都 是 有 定义 的 。 每 一 个 函数 执行 时 都 像 
一 个 单一 操作 ， 而 且 不 能 产生 任何 外 部 可 见 的 异常 。 

对 所 有 的 贤 数 ， 如 果 输 入 参数 位 于 函数 的 定义 域 之 外 ， 则 发 生 定义 域 错误 。 每 一 个 
函数 的 说 明 都 要 列 出 所 有 的 定义 域 错 误 。 如 果 一 个 定义 域 错误 和 函数 的 定义 ”一致 ， 那 
么 实现 也 可 以 额外 地 定义 这 个 错误 。 发生 定义 域 错误 时 ， 函 数 返 回 一 个 由 实现 定义 的 值 ， 
errno 设置 为 宏 EDOM, 

相似 地 ， 如 果 结 果 不 能 表示 为 double 值 ， 则 发 生 值 域 错误 。 如 果 结 果 上 洲 〈 结 果 的 
数值 太 大 而 不 能 在 指定 类 型 的 对 象 中 表示 )， 函 数 返 回 宏 HUGE VAL 的 值 ， 符 号 与 函数 的 下 
FEE (除了 函数 tan), errno 设置 为 宏 ERANGE。 如 果 结 果 下 游 〈 结 果 的 数值 太 小 而 
不 能 在 指定 类 型 的 对 象 中 表示 )， 荫 数 返 回 零 ，errno 是 否 取 宏 ERANGE 的 值 是 实现 定义 的 。 
7.5.2 ZAAK 
7.5.2.1 函数 acos 

概述 

finclude «math.h» 
double acos (double x); 


说 明 

函数 acos 计算 x 的 三 角 反 余弦 函数 主 值 。 如 果 参 数 不 在 [-1, 1] 范围 内 ， 则 发 生 定义 
域 错 误 。 

返回 值 

函数 acos 返回 [0, n] 弧度 范围 内 的 反 余弦 值 。 
7.5.2.2 函数 asin 

概述 


#include «math. h> 
double asin(double x); 


说 明 

函数 asin 计算 x 的 三 角 反 正弦 函数 主 值 。 如 果 参 数 不 在 [-1 +1] 范围 内 ， 则 发 生 定义 
域 错误 。 

返回 值 

函数 asin 返回 [ — 2/2, + 1/2] MERA RIESE. 
7.5.2.3 函数 atan 

概述 


#include «math.h» 
double atan(double x); 
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--- ERIN] ISI 
说 明 
函数 atan 计算 x 的 三 角 反 正切 函数 主 值 。 
返回 值 
函数 atan 返回 [ 一 m2, 十 mw2] 弧度 范围 内 的 反正 切 值 。 
atan2 | 7.5.2.4 函数 atan2 
概述 


include «math.h» 
double atan2 (double y, double x); 
说 明 
函数 atan2 计算 y/x 的 三 角 反 正切 函数 主 值 ， 根 据 两 个 参数 的 符号 确定 返回 值 的 象限 
信息 。 若 两 个 参数 都 为 零 ， 则 发 生 定义 域 错误 。 
返回 值 
函数 atan2 返回 v/x 的 反正 切 ， 在 [一式 + n] 弧度 范围 内 。 
cos | 7.5.2.5 函数 cos l 
概述 
#include <math.h> 
double cos(double x); 
说 明 
函数 cos 计算 x〈 以 弧度 为 单位 ) 的 余弦 值 。 
返回 值 
函数 cos 返回 余弦 值 。 
sin | 7.5.2.6 函数 sin 
概述 


#include <math.h> 
double sin(double x); 


说 明 
函数 sin 计算 x QUE AR) MERE. 
返回 值 
函数 sin 返回 正弦 值 。 
tan | 7.5.2.7 函数 tan 
概述 


include <math.h> 
double tan(double x); 


说 明 
函数 tan 返回 x (以 弧度 为 单位 ) 的 正切 值 。 
返回 值 
函数 tan 返回 正切 值 。 
7.5.3 双 曲 函数 
cosh | 7.5.3.1 函数 cosh 
概述 


#include «math.h> 
double cosh(double x); 


说 明 
函数 cosh 计算 x 的 双 曲 余弦 。 若 < 的 数值 太 大 ， 则 发 生 值 域 错误 。 
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oe 


tanh 
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ldexp 


返回 值 

函数 cosh 返回 双 曲 余弦 值 。 
7.5.3.2 函数 sinh 

概述 


#include «math.h» 
double sinh (double x); 
说 明 
函数 sinh 计算 x 的 双 曲 正弦 。 如 果 x 的 数值 太 大 ， 则 发 生 值 域 错误 。 
返回 值 
函数 sinh 返回 双 曲 正弦 值 。 
7.5.3.3 函数 tanh 
概述 


#include <math.h> 
double tanh(double x); 


说 明 

函数 tann 计算 x 的 双 曲 正切 。 

返回 值 

函数 tanh 返回 双 曲 正切 值 。 
7.5.4 指数 函数 和 对 数 函 数 
7.5.4.1 函数 exp 

概述 


finclude <math.h> 
double exp(double x); 


说 明 
函数 exp 计算 x 的 指数 函数 。 若 x 的 数值 太 大 ， 则 发 生 值 域 错误 。 
返回 值 
函数 exp 返回 指数 值 。 
7.5.4.2 函数 £rexp 
概述 


#include <math.h> 
double frexp(double value, int *exp); 


说 明 
函数 frexp 把 一 个 浮 点 数 分 为 一 个 规格 化 小 数 和 一 个 2 的 整数 寡 。 它 把 整数 值 存储 在 
exp 指向 的 int 类 型 的 对 象 中 。 
返回 值 
函数 frexp 返回 值 x， 使 x 为 [1/2, 1) 范围 内 的 double 值 ， 或 者 为 零 ， 且 value 等 于 
x 2 的 *exp KE. UA value 为 零 ， 则 结果 的 两 部 分 都 为 零 。 
7.5.4.3 函数 1dexp 
概述 
#include <math.h> 
double ldexp(double x, int exp); 


说 明 
函数 dap 计算 一 个 浮 点 数 和 2 的 整数 宪 的 乘积 ， 有 可 能 发 生 值 域 错 误 。 
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返回 值 
RÅ Ldexp 返回 x 乘 以 2 的 exo KEKE. 
log | 7.5.4.4 函数 log 
概述 
#include «math.h» 
double log(double x); 
说 明 
函数 log 计算 x 的 自然 对 数 。 如 果 参 数 为 负 ， 则 发 生 定义 域 错误 ， 如 果 参 数 为 零 ， 则 
发 生 值 域 错误 。 
返回 值 
PRAE Log 返回 自然 对 数值 。 
1og10 | 7.5.4.5 函数 log10 
概述 


#include «math.h» 
double logl10 (double x); 


说 明 
函数 1og10 计算 x 的 以 10 为 底 的 对 数 。 如 果 参 数 为 负 ， 则 发 生 定 义 域 错误 ， 如 果 参 
数 为 零 ， 则 可 能 发 生 值 域 错 误 。 
返回 值 
函数 10910 返回 以 10 为 底 的 对 数 。 
modf | 7.5.4.6 QA modf 


概述 


#include <math.h> 
double modf (double value, double *iptr); 
说 明 
函数 modt 把 参数 value 分 为 整数 部 分 和 小 数 部 分 ， 它 们 的 符号 和 参数 的 相同 。 它 把 
整数 部 分 存储 在 iptr 指向 的 double 类 型 的 对 象 中 。 
返回 值 
函数 modf 返回 value 的 带 符号 的 小 数 部 分 。 
7.5.5 BAR 
pow | 7.5.5.1 函数 pow 
概述 


finclude «math.h» 
double pow(double x, double y): 


说 明 
PR pow 计算 x MY KF. UR x 为 负 值 上 且 y 不 是 一 个 整数 值 ， 则 发 生 定义 域 错误 。 
当 x ASA y 小 于 等 于 零 时 ， 如 果 结 果 不 能 表示 ， 则 发 生 定义 域 错误 。 也 可 能 发 生 值 域 错误 。 
返回 值 
函数 pow ik E x KI y KRE 
sqrt | 7.5.5.2 ig ert 
概述 


#include <math.h> 
double sqrt (double x); 
说 明 
B sart 计算 x 的 非 负 的 平方 根 。 如 果 参 数 为 负 ， 则 发 生 定义 域 错误 。 


返回 什 
Å sart 返回 平方 根 的 值 。 
7.5.6 取 整 函数 、 绝 对 值 和 取 余 函数 
ceil | 7.5.6.1 函数 ceil 
概述 


#include <math.h> 
double ceil(double x); 


说 明 
函数 ceil 计算 不 小 于 x 的 最 小 整数 。 
返回 值 


函数 ceil 返回 不 小 于 x 的 最 小 整数 ， 表 示 为 double 类 型 。 
fabs | 7.5.6.2 函数 fabs 
概述 
#include <math.h> 
double fabs(double x); 
说 明 
函数 fabs 计算 浮 点 数 x 的 绝对 值 。 
返回 值 
函数 fabs 返回 x 的 绝对 值 。 
floor | 7.5.6.3 函数 floor 
概述 


#include <math.h> 
double floor (double x); 


说 明 

PRIX floor 计算 不 大 于 x 的 最 大 整数 。 

返回 值 

函数 floor 返回 不 大 于 x 的 最 大 整数 ， 表 示 为 double 类 型 。 
fmod | 7.5.6.4 函数 £mod 

概述 


#include <math.h> 
double fmod(double x, double y); 


说 明 

函数 fmod 计算 x/y 的 浮 点 余数 。 

返回 值 

对 某 个 整数 值 ?， 函数 fmod 返回 值 x-i*y。 因 此 ， 如 果 y 不 为 零 ， 结 果 的 符号 和 x 相 
HERE Lt v dD: 如 果 y 为 零 ， 则 或 者 发 生 定义 域 错误 ， 或 者 函数 fmod 返回 零 ， 这 是 
由 实现 定义 的 。 

脚注 

103. 参考 “ 库 的 展望 ”(7.13.4)。 

104. HUGE. VAL 在 支持 无 穷 大 的 实现 上 可 以 是 正 无 穷 大 。 

105. 在 一 个 支持 无 穷 大 的 实现 下 ， 如 果 函 数 的 数学 定义 域 不 包括 无 穷 大 ， 就 允许 把 无 

穷 大 作为 一 个 定义 域 错误 的 参数 对 待 。 
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7.3 «math.h» 的 使 用 


HUGE VAL 


acos 


asin 


atan2 


ceil 


在 使 用 «math.h» 中 声明 的 函数 之 前 ， 你 应 该 对 它们 很 熟悉 因为 很 少 有 人 
会 突然 想 计算 一 个 角 的 余弦 ， 所 以 对 下 面 每 个 函数 的 常规 解释 都 很 少 。 


HUGE_VAI 一 一 这 个 宏 通常 会 展开 为 一 个 非常 大 的 double 常量 ， 它 一 般 情 
况 下 和 «float.h» 中 定义 的 DBL MAX 展开 的 值 相 等 。 在 那些 对 无 穷 大 (Inf) 
不 提供 特殊 编码 的 机 器 上 ， 通 常 认 为 返回 这 样 的 一 个 大 值 是 警告 发 生 了 值 域 
错误 的 最 好 方式 。 然 而 ， 即 使 被 警告 了 ，HUGE_VAL 也 能 和 Inf 相等 。 把 一 个 
数学 函数 的 返回 值 和 HUGE. VAL 或 者 -HUGE_VAL 相 比 较 可 能 会 很 安全 。( 检 测 
errno 是 否 设 置 为 ERANGE 可 能 会 更 好 ， 这 两 个 宏 都 在 <errno.h> 中 定义 。) 
不 要 通过 任何 其 他 的 方式 使 用 HUGE. VAL, 


函数 acos 和 asin 经 常 使 用 同一 个 函数 来 计算 。 每 一 个 函数 
都 在 给 出 一 个 直角 三 角形 的 一 条 直角 边 和 和 斜 边 的 前 提 下 计算 出 它 的 一 个 锐 
角 值 。 因 此 ， 要 注意 acos 的 参数 是 一 个 比例 量 ， 特 别 是 当 它 的 一 个 参数 具 
Å sqrt(1.0 - x * x) 这 样 的 形式 时 更 是 如 此 。 因 此 ， 最 好 去 调用 asin, 
atan 或 者 atan2。 


参考 上 面 的 acos. 


atan— Kğ atan 和 atan2 经 常 使 用 一 个 公共 函数 来 计算 。 然 而 ， 后 
者 更 常用 。 要 优先 使 用 后 者 ， 特 别 是 当 参 数值 是 一 个 比值 的 时 候 。 同 样 参考 
上 面 的 acos, 


atan2 一 一 给 定 蕊 了 平面 上 的 一 个 点 坐标 ， 该 函数 能 有 效 地 计算 一 个 半 
径 向 量 与 无 轴 构成 的 角 。 目 前 它 是 acos, asin, atan 和 atan2 这 四 个 函数 
中 最 常用 的 函数 。 因 此 ， 要 优先 使 用 这 个 函数 。 

ceil 一 一 函数 ceil, floor 和 modé 让 你 可 以 通过 各 种 方式 对 一 个 浮 点 
数 的 小 数 部 分 进行 操作 。 使 用 这 些 函 数 要 比 把 浮 点 数 转换 为 整数 类 型 安全 得 
多 ， 因 为 它们 可 以 对 任意 的 浮 点 值 进行 操作 而 不 会 造成 溢出 。 注 意 ，ceil 向 


acos 


asin 


”XY 轴 的 右边 取 值 ， 而 floor 向 左边 取 值 。 想 要 得 到 和 浮 点 值 x 最 接近 的 整数 ， 


AWS: 

x < 0.0 ? ceil(x - 0.5) : floor(x + 0.5) 

cos 一 一 函数 cos 和 sin 经 常 使 用 同一 个 函数 来 计算 。 每 一 个 函数 都 把 
它们 的 参数 以 革 轴 或 者 了 轴 为 中 心 减 小 到 弧度 的 范围 。 因 此 要 注意 cos 的 
那些 包含 了 w2 的 整数 倍 的 参数 ， 这 时 可 能 会 调用 sin 来 代替 它 。 可 以 省 略 
参数 中 的 任何 2*x 的 倍数 。 函 数 对 于 消除 2*r 的 倍数 的 工作 可 能 会 比 手工 
做 得 好 ， 但 是 ， 参 数 每 增加 一 个 2*r，cos 的 结果 的 精度 几乎 就 会 减少 3 位 。 


136 


第 7 章 


<math.h> 


cosh 


frexp 


ldexp 


log 


modf 


sin 


sinh 


对 于 是 够 大 的 参数 来 说 ， 即 使 这 个 函数 没有 报错 ， 它 的 结果 可 能 也 没有 什么 
意义 了 。 


cosh 


可 以 使 用 这 个 函数 来 代替 下 面 的 恒等式 ; 

cosh(x) =0.5 * (exp(x) + exp(-x)) 
或 者 它 的 任何 优化 形式 。 和 这 个 表达 式 不 同 ，cosh 会 产生 一 个 更 精确 的 结 
果 ， 并 且 它 黎 盖 了 函数 值 可 表示 的 全 部 x 的 范围 。 

exp 一 一 如 果 exp 的 参数 具有 v*log (x) 的 形式 ， 就 用 pow Guy) 代替 
这 个 表达 式 。 后 者 会 更 精确 。 

fabs 一 一 这 个 测 数 应 该 相当 快 。 如 果实 现 支 持 Inf 和 -Inf 这 样 的 特殊 编 
码 的 话 ， 对 这 样 的 参数 ， 这 个 函数 也 会 计算 出 正确 的 结果 。 


floor 人 参考 上 面 的 ceil。 
fmod 一 一 这 个 函数 确定 浮 点 运算 中 类 似 于 整数 除法 中 余数 的 值 。 有 时 候 


可 以 利用 它 通过 重复 迭代 把 一 个 参数 缩减 到 一 个 子 区 域 ， 因 为 fmod He pr 
减 去 该 区 间 的 一 个 倍数 更 好 而 且 更 安全 。 然 而 ， 本 章 后 面 描述 的 其 他 的 技术 
在 参数 的 缩减 方面 会 做 得 更 好 。 

frexp 一 一 当 需 要 对 一 个 浮 点 值 的 小 数 部 分 和 指数 部 分 独立 地 进行 操作 
时 ， 可 以 使 用 这 个 函数 来 把 一 个 浮 点 值 分 为 两 部 分 。 和 它 相对 的 函数 是 下 面 
的 1dexp. 

ldexp 一 一 在 对 一 个 浮 点 值 的 整数 和 指数 部 分 分 别 进行 操作 之 后 ， 可 以 
使 用 这 个 函数 把 它们 重新 组 合 起 来 。 和 它 相 对 的 函数 是 上 面 的 frexp。 
log (x) 是 自然 对 数 ， 经 常 记 做 log(x) 或 者 In(x)。 当 然 ， 可 以 通 
过 乘 以 一 个 转换 因子 loge 或 者 1/10g. (b) 得 到 x 对 任何 底数 5 的 对 数值 。 

log10 10910 (x) 通常 由 log (x) 计算 。 如 果 要 对 log10 4 Reb 
一 个 转换 因子 ， 那 么 不 妨 考 虑 一 下 使 用 100 KRBE. 

modf 一 一 当 和 需要 对 一 个 浮 点 值 的 整数 部 分 和 小 数 部 分 分 别 进行 操作 时 ， 
可 以 使 用 这 个 函数 对 浮 点 值 进行 拆 分 。 

pow 一 一 这 个 函数 通常 是 <math.h> 中 声明 的 所 有 函数 中 说 明 最 详细 的 一 
个 。 一 个 好 的 实现 会 为 pow(x,y) 生成 一 个 比 它 的 等 价 形式 exp (y*1og (x) ) 
更 好 的 结果 ， 然 而 ， 它 花费 的 时 间 可 能 也 更 长 。 当 e 是 自然 对 数 的 底数 时 ， 


可 以 用 exp(y) 代替 pow(e,y)， 用 sqrt (x) 代替 pow(x,0.5)， 用 x*x 代替 
pow(x,2.0), 


log 


Sir 


参考 上 面 的 cos. 
使 用 这 个 函数 来 代替 下 面 的 恒等式 


sinh(x) = 0.5 * (exp(x) - exp(-x)) 


sinh 
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tan 


tanh 


或 者 它 的 任何 优化 形式 。 和 这 个 表达 式 不 同 ，sinh 应 该 产生 一 个 更 精确 的 结果 ， 
特别 是 对 比较 小 的 参数 。 这 个 函数 也 覆盖 了 函数 值 可 以 表示 的 x 的 所 有 范围 。 


sqrt 一 一 这 个 消 数 通常 比 它 的 等 价 式 pow(x,0.5) KAS. 


tan 一 一 这 个 函数 首先 把 它 的 参数 缩小 到 以 对 轴 为 中 心 的 n 弧 度 的 范围 
内 ， 因 此 可 以 省 略 任 何 加 到 参数 上 的 2*x 的 倍数 。 函 数 在 消除 2*r 的 倍数 方 
面 可 能 要 比 手工 做 得 好 。 但 是 ， 参 数 每 增加 一 个 2*r，tan 的 结果 的 精度 就 
几乎 减少 3 位 。 对 于 很 大 的 参数 来 说 ， 即 使 这 个 函数 没有 报错 ， 它 的 结果 可 
能 也 没有 什么 意义 了 。 

tanh 一 一 使 用 这 个 函数 代替 恒等式 : 

tanh(x) 三 (exp(2.0 * x) - 1.0) / (exp(2.0 * x) + 1.0) 
或 者 它 的 任何 优化 形式 。 和 这 个 表达 不 同 ， 这 个 函数 应 该 产生 一 个 更 精确 的 
结果 ， 特 别 是 对 比较 小 的 参数 。 这 个 函数 也 覆盖 了 函数 值 可 以 表示 的 所 有 的 
x 的 范围 。 


7.4 <math.h> 的 实现 


头 文件 


<math.h> 


% HUGE VAL 


«math.h» 中 包含 了 各 种 各 样 的 函数 。 我 把 它们 分 为 3 组 进行 讨论 。 


D 对 一 个 浮 点 值 的 组 成 部 分 进行 操作 的 半数 字 函 数 ， 这 些 组 成 部 分 包括 
指数 部 分 、 整 数 部 分 和 小 数 部 分 等 。 

D RSRK ARM. 

C) Im, MÅR BORER AL. 


在 这 个 过 程 中 我 也 给 出 了 几 个 低级 原 语 ，<math.h> 中 声明 的 所 有 函数 都 
使 用 这 些 函 数 ， 这 样 ， 它 们 就 不 会 依赖 于 浮 点 值 的 特殊 表示 。7.1 节 讨 论 了 
由 这 些 特 殊 的 原 语 集合 决定 的 机 器 的 一 般 属 性 。 我 要 再 强调 一 次 ， 参 数 化 并 
没有 覆盖 现代 计算 机 中 使 用 的 所 有 的 浮 点 表示 。 所 以 有 时 候 必 须 为 菜 些 计算 
机 体系 结构 修改 一 个 或 者 更 多 的 原 语 ， 甚 至 可 能 会 修改 更 高 级 别 的 函数 。 


图 7-1 显示 了 文件 math.h， 这 个 文件 中 有 些 让 人 不 太 明 白 的 地 方 。 甚 中 
一 点 是 隐 式 宏 。 因 为 文件 中 的 某 些 数学 函数 依次 调用 其 他 的 函数 ， 而 这 些 隐 
式 宏 消 除了 一 次 函数 调用 。 

还 有 一 点 是 宏 HUGE_VAD。 它 被 定义 为 IEEE 754 的 +inf 编码 。 为 了 实现 
这 一 点 ， 我 引入 了 类 型 _pconst， 它 是 一 个 联合 ， 且 允许 把 一 个 数据 对 象 初 
始 化 为 由 四 个 unsigned short 类 型 的 值 组 成 的 数组 ， 然 后 把 这 个 数据 对 象 作为 
double 类 型 访问 《参考 4.4 节 ， 一 个 相似 的 技巧 )。 数 据 对 象 _Hugeval 是 以 
这 种 方式 构建 起 来 的 几 个 浮 点 值 之 一 。 
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图 7-1 /* math.h standard header */ 
math.h #ifndef MATH 
#define MATH 
/* macros */ 
#define HUGE VAL Hugeval. D 
/* type definitions */ 
typedef const union { 
unsigned short _W[4]; 
double D; 
) Dconst; 
/* declarations */ 
double acos (double); 
double asin (double); 
double atan (double); 
double atan2 (double,double); 
double ceil (double); 
double cos (double); 
double cosh (double); 
double exp (double); 
double fabs (double); 
double floor (double); 
double fmod (double,double); 
double frexp (double,int *); 
double ldexp (double,int); 
doubie log (double); 
double log10 (double); 
double modf (double,double*); 
double pow (double,double); 
double sin (double); 
double sinh (double); 
double sqrt (double); 
double tan (double); 
double tanh(double); 
double Asin (double,int); 
double Log (double,int); 
double Sin (double,unsigned int); 
extern Dconst  Hugeval; 
/* macro overrides */ 
#define acos (x) Asin (x, 1) 
#define asin (x) Asin (x, 0) 
#define cos (x) Sin (x, 1) 
#define log(x) _Log(x, 0) 
#define logl10 (x) _Log(x, 1) 
#define sin (x) _Sin(x, 0) 
#endif 


图 7-2 


xvalues.c 


 Hugeval Inf 
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/* values used by math functions -- IEEE 754 version */ 
finclude "xmath. h" 


/* macros */ 
#define NBITS (48+ DOFF) 
Rif DO 
#define INIT (wO) 0, 0, 0, wO 
felse 
#define INIT(wO) w0, 0, 0, 0 


fendif 
/* static data */ 
_Dconst_Hugeval = ((INIT(-DMAX«« DOFF))); 
.Dconst Inf = ((INIT( DMAX«« DOFF))); 
 Deonst Nan = ((INIT( DNAN))): 
.Dconst Rteps = ((INIT(( DBIAS-NBITS/2)«« DOFF))); 
.Dconst Xbig = ((INIT(( DBIAS+NBITS/2) << DOFF))); 


图 7-2 显示 了 文件 xvalues.c， 它 定义 了 一 些 值 。 该 文件 包含 了 和 
_Hugeval 相对 应 的 Inf 的 定义 。 我 提供 这 两 个 值 ， 以 供 修改 HUGE VAL 的 
定义 。 这 个 文件 也 定义 了 如 下 几 个 值 : 

D _Nan， 当 操作 数 都 不 是 NaN 时 ， 函 数 返回 的 NaN 的 编码 。 

O Rteps, DBL EPSILON 的 平方 根 〈 近 似 值 )， 某 些 函 数 使 用 它 在 不 同 

的 近似 值 之 间作 出 选择 。 
D _Xbig，_Rteps._D 的 相反 数 ， 某 些 函 数 使 用 它 在 不 同 的 近似 值 之 间 
作出 选择 。 
当 你 知道 函数 是 怎样 使 用 最 后 两 个 值 的 时 候 ， 这 两 个 值 的 作用 也 就 体现 出 来 了 。 
实际 上 文件 xvalues.c 的 可 读 性 很 差 ， 它 参数 化 的 形式 和 图 4-3 的 文件 
xfoat.c 很 相似 。 这 两 个 文件 都 利用 了 内 部 头 文件 <yvals.h> 中 定义 的 依赖 
于 具体 系统 的 参数 。 

xvalues.c 并 没有 直接 地 包含 <yvals.h>， 而 是 包含 了 内 部 头 文件 
"math.h"， 而 该 头 文件 又 包含 了 <yvals.h>。 所 有 实现 «math.h» 的 文件 都 
包含 了 "xmath.h"。 因 为 该 文件 包含 的 内 容 太 零散 ， 所 以 我 只 在 必要 的 时 候 
才 给 出 相关 部 分 内 容 。 在 图 7-38 中 有 "xmath.h" 的 一 个 完整 的 列表 。 下 面 
是 "xmath.h" 中 定义 的 和 xvalues.c 相关 的 宏 : 

#define DFRAC ((l<< DOFF)-1) 


#define DMASK (0 x7fff&- DFRAC) 
#define | DMAX((1««(15- DOFF))-1) 
#define | DNAN (0x8000| DMAX«« DOFF|l<<( DOFF-1)) 


整理 上 面 这 些 看 起 来 没有 意义 的 东西 ， 就 会 发 现 : 

O Inf 的 编码 具有 所 有 小 数位 为 等 的 最 大 可 能 的 特征 值 〈_DMAX)。 

口 生成 的 NaN 的 编码 拥有 小 数位 的 最 高 有 效 位 已 经 被 设置 的 最 大 可 能 
的 特征 值 。 
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<math.h> 


图 7-3 
fabs.c 


HÅ fabs 


函数 Dtest 


/* fabs function */ 
include "xmath.h" 


double (fabs) (double x) 
H /* compute fabs */ 
switch ( Dtest (&x) ) 
{ /* test for special codes */ 
case NAN: 
errno = EDOM; 
return (x) ; 
case INF: 


errno = ERANGE; 
return (_Inf._D) ; 
case 0: 
return (0.0) ; 
default: /* finite */ 
return (x «0.0? -x : x) ; 


} 


一 般 来 说 ，NaN 应 该 至 少 有 一 个 非 零 的 小 数位 。 对 NaN 使 用 这 种 特殊 的 编 
码 是 为 了 和 Intel 80X87 数学 协 处 理 器 相 匹 配 。 


所 有 这 些 编码 的 出 现 使 最 简单 的 数学 函数 变 得 不 简单 了 了。 例如， 图 7-3 显 
示 了 文件 fabs.c， 在 比较 简单 的 情况 下 ， 可 以 把 它 概 括 为 最 后 一 个 返回 语句 : 
return (x < 0.0? -x : x); 
然而 ， 在 这 里 ， 在 处 理 参 数 x 的 有 限 值 和 零 同时 ， 我 们 还 想 要 恰当 地 处 理 
NaN, -Inf 和 +Inf。 这 就 会 花费 更 多 的 判断 语句 。 


图 7-4 显示 了 文件 xatest.c， 它 定义 了 对 一 个 double 值 进行 分 类 的 函 
数 _Dtest。 内 部 头 文件 "xmath.h" 定义 了 Dtest 使 用 的 各 种 偏 移 量 和 类 别 
值 ， 这 里 相关 的 宏 定义 有 : 


/* word offsets within double */ 


Hif DO==3 

#define DL 2 /* little-endian order */ 
#define D2 1 

#define D3 0 

#else 

#define ` DI 1 /* big-endian order */ 
#define _D2 2 

#define _D3 3 

fendif 


/* return values for D functions */ 
#define FINITE -1 
#define INF 1 
#define NAN 2 


注意 一 个 特征 值 为 零 的 浮 点 值 不 一 定 为 零 ，IEEE 754 支持 渐进 的 下 洲 ， 一 个 
值 具 有 在 所 有 位 〈 除 了 符号 位 ) 都 是 零 的 时 候 才 是 零 。 
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图 7-4 


xdtest.c 


ceil floor 


函数 Dint 


图 7-5 


ceil.c 


E] 7-6 


floor.c 


/* Dtest function -- IEEE 754 version */ 
#include "xmath.h" 


short _Dtest (double *px) 
{ /* categorize *px 
unsigned short *ps = (unsigned short *)px; 
short xchar = (ps[ DO] & _DMASK) >> _DOFF; 


if (xchar ==_DMAX) /* NaN or INF 

return (pel DO] & DFRAC || ps[ DL] 

|! pel D2] || ps[_D3] ? NAN : INF); 

else if (0 < xchar || ps[ DO] & | DFRAC 

I! ps[ D1] |! pst. D2] || ps [_D3]) 

return (FINITE); /* finite 
else 

return (0); /* zero 


} 


图 7-5 显示 了 文件 ceil.c, Å 7-6 显示 了 文件 Hoor.c。 这 些 文件 中 定义 
的 每 一 个 函数 都 要 把 它 的 参数 x 的 所 有 小 数 部 分 都 设置 为 零 ， 而 且 都 需要 知 
道 小 数 部 分 的 初始 值 是 不 是 为 非 零 。 然 后 每 一 个 函数 通过 略微 不 同 的 方式 对 
剩余 的 整数 部 分 进行 调整 。 


图 7-7 显示 了 文件 xaint.c， 该 文件 定义 了 函数 Dirt, Jup *px 是 一 
个 有 限 值 ， 该 函数 就 对 所 有 小 于 闭 值 的 小 数位 进行 测试 和 清 零 。 那 个 阔 值 是 
2 的 xexp 次 守 。( 其 他 的 函数 也 有 可 能 用 xep 的 值 而 不 是 零 来 调用 Dint.) 
对 小 数位 进行 清 零 的 代码 也 有 一 定 的 技巧 。 


注意 ps[sub[xchar]1 中 在 一 个 下 标 中 使 用 另 一 个 下 标的 用 法 。 下 标 
sub[xchar] 纠正 了 不 同 的 计算 机 体系 结构 下 浮 点 值 设 计 的 差别 。switch 语句 
包括 了 一 连 串 的 case 标号 ， 这 通常 是 一 种 容易 被 误解 、 不 太 明智 的 做 法 。 然 
而 ， 为 了 提高 性 能 ， 这 两 种 方法 我 都 用 了 。 


/* ceil function */ 
finclude "xmath.h" 


double (ceil) (double x) 
{ /* compute ceil(x) */ 
return ( Dint(&x, 0) < 0 & 0.0 <x ? x + 1.0: x) ; 
} 口 


/* floor function */ 
#include "xmath.h" 


double (floor) (double x) 
{ /* compute floor(x) */ 
return ( Dint(&x, 0) < 0 && x < 0.0? x - 1.0 : x); 
} a 
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图 7-7 /* Dint function -- IEEE 754 version */ 
xdint.c #include "xmath.h" 


short Dint(double *px, short xexp) 
( /* test and drop (scaled) fraction bits 
unsigned short *ps - (unsigned short * )px; 
unsigned short frac = ps( DO] & _DFRAC 
{| pel DL] |! ps[. D2] || pst, mäi: 
short xchar = (ps[ DO] & _DMASK) >> _DOFF; 


if (xchar -- 0 && !frac) 

return (0); /* zero 
else if (xchar !- _DMAX) 

H /* finite 
else if (!frac) 

return (INF) ; 
else 

{ 

errno = EDOM; 

return (NAN) ; 

} 
xchar = (_DBIAS+48+_DOFF+1) - xchar - xexp; 
if (xchar <= 0) 

return (0); /* no frac bits to drop 
else if ((48+_DOFF) < xchar) 

{ /* all frac bits 

Del DO] = 0, ps[ Di] : 

Del D2] = 0, ps(. D3] 

return (FINITE); 


/* strip out frac 
static const unsigned short mask[] = ( 
0x0000, 0x0001, 0x0003, 0x0007, 
Ox000f, OxOO1f, Ox003f, O0x007f, 
OxOOff, OxOlff, OxO3ff, OxO7ff, 
OxOfff, Oxlfff, Ox3fff, Ox"7fff):; 
Static const size t sub[] = ( D3, D2, DL, DO: 


frac - mask[xchar & Oxf]; 
xchar >>= 4; 
frac &- ps[sub[xchar]]; 
ps[sub[xchar]] ^= frac; 
switch (xchar) 
{ /* cascade through! */ 

case 3: 

frac |= ps[ D1], ps[ D1] 
case 2 

frac |= ps[ D2], ps[ D2] 
case 1 

frac |= ps[ D3], ps[ Däi 

) 
return (frac ? FINITE : 0); 
) 
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图 7-8 [7* modf function */ 
modf.c #include "xmath.h" 


double (modf) (double x, double *pint) 
{ /* compute modf(x, &intpart) */ 
*pint = x; 
switch (_Dint(pint, 0)) 


{ /* test for special codes */ 
case NAN: 
return (x); 
case INF: 
case 0: 
return (0.0); 
default : /* finite */ 
return (x - *pint); 
H 
) D 
函数 moaf 图 7-8 显示 了 文件 modf .c。 它 定义 了 函数 modaf， 该 函数 只 是 比 ceil 和 
floor 看 起 来 复杂 一 点 。 和 那些 函数 一 样 ，modf 也 依靠 函数 Dint 来 完成 那 
些 困难 的 部 分 。 


函数 frexp Ed 7-9 显示 了 文件 frexp.c。 它 定义 了 函数 frexp， 这 个 函数 从 一 个 有 
限 大 小 的 参数 x 中 提取 出 它 的 指数 。 又 一 次 ， 一 个 相当 简单 的 函数 由 于 各 种 
特殊 编码 的 存在 而 变 得 复杂 了 。 又 一 次 ， 一 个 更 加 灵活 的 低级 函数 完成 了 大 
部 分 困难 的 工作 。 


图 7-9 /* frexp function */ 
frexp.c #include "xmath.h" 


double (frexp) (double x, int *pexp) 
{ /* compute frexp(x, &i) */ 
short binexp; 


switch (_Dunscale (&binexp, &x)) 
{ /* test for special codes */ 
case NAN: 
case INF: 
errno EDOM; 
*pexp 0; 
return (x) ; 
case 0: 
*pexp = 0; 
return (0.0); 
default: /* finite */ 
*pexp - binexp; f 
return (x); 


I 


<math.h> 


/* ldexp function */ 
#include "xmath.h" 


double 

{ 

switch ( Dtest(&x)) 
{ 

case NAN: 
errno 
break; 

case INF: 
errno 
break; 

case 0: 
break; 

default: 


(ldexp) (double x, 


EDOM; 


if (0 <= _Dscale(&x, 
ERANGE ; 


errno = 
} 
return (x); 


} 


图 7-11 


xdunscal.c 


finclude "xmath.h" 


short | Dunscale(short *pex, 


int xexp) 


compute ldexp(x, xexp) */ 


test for special codes */ 


/* finite */ 
xexp)) 


/* Dunscale function -- IEEE 754 version */ 


double *px) 


{ /* separate *px to 1/2 <= |frac| < 1 and 2^*pex 


unsigned short *ps - 
(ps[ DO] & _DMASK) >> _DOFF; 


short xchar = 


if(xchar == _DMAX) 
{ 


*pex = 0; 


return(ps[ D0]&  DFRAC | | 
ps [_D3] 


I! ps[ D2] || 
} 
else if 
{ 
ps[ DO] = 
*pex = 
return (FINITE); 
) 
else 
( 
*pex - 0; 
return(0); 


} 


(0 < xchar | 


(unsigned short *)px; 


/* NaN or INF 
Del D1] 
? NAN INF); 
(xchar =  Dnorm(ps))!- 0) 
/* finite,reduce to [1/2,1) 


ps[ DO] & - DMASK | _DBIAS << , DOFF; 
xchar -  DBIAS; 


/*zero 


图 7-12 


xdscale.c 


7.4 


/* Dscale function -- IEEE 754 version */ 
#include "xmath.h" 


short Dscale(double *px, short xexp) 
{ /* scale *px 
long lexp; 
unsigned short *ps = 
short xchar = 


(unsigned short * 
(ps [ DO] 6 _DMASK) 


if (xchar == DMAX) 

return (ps[ DO] 6 DFRAC || 
|| pst. D2] |I 
(0 « xchar) 


psi DL 
ps[. D3] ? NAN : 
else if 
else if ((xchar = 

return (0); 
lexp = (long)xexp + xchar; 
if ( DMAX «- lexp) 


.Dnorm(ps)) 


{ /* overflow , 


*px = ps[ DO] 6 _DSIGN ? -_Inf._D 
return (INF); 
} 


else if (0 < lexp) 


{ i /* finite result, 


ps [ DO] = ps [DO] 6 - DMASK | 
return (FINITE) ; 
) 
else 
{ 
unsigned short sign = ps [ DO] 
ps[ DO] = 
if (lexp < -(48+ DOFF+1)) 
xexp = -1; 
else 
{ 
for (xexp = 
{ 
ps [_D3] = 
Gel D1] = 
) 
if ((xexp = 
{ 
ps(_D3] = ps{_D3] >> xexp 
| psi D2] << 16 - xexp; 
ps[_D2] = ps[ D2] >> xexp 
| psl Dl] << 16 - xexp; 
ps[ D1] = ps[_D1] >> xexp 
| ps[ DO] << 16 - xexp; 
ps[ DO] >>= xexp; 
) 


lexp: xexp <= -16; 


Gel D2], ps[ D2] 


-xexp) != 0) 


6 ] 


1 << DOFF | pst DO] 6 1 


ps[ DO0],ps[ DO] = 
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by 2^xexp with checking 


)px; 


>> _DOFF; 


] 
INF); 


/* finite 


/* zero 


return +/-INF 
Inf. D; 


repack 


(short)lexp << , DOFF; 


/* denormalized, scale 


DSIGN; 


DFRAC; 


/* certain underflow 


/* might not underflow 


xexp += 16) 


/* scale by words 
ps[ Di]: 


0; 


/* scale by bits 
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图 7-12 if (0 <= xexp && (ps[ DO] || ps[ Di] 
WA |} ps[ D2] || pst. D31)) 
{ /* denormalized */ 
Gel DO] | = sign; 
return (FINITE); 
H 
else 
{ /* underflow, return +/-0 */ 
ps[ DO] = sign, ps[ D1] = 0; 
psi D2] = 0, ps[_D3] = 0; 
return (0); 
} 
} 
} 口 


图 7-13 /* _Dnorm function -- IEEE 754 version */ 
xdnorm.c #include "xmath.h" 


short  Dnorm(unsigned short *ps) 
{ /* normalize double fraction 
short xchar; 
unsigned short sign = ps [ DO] & _DSIGN; 


xchar = 0; 
if ((ps[ DO] &= DFRAC) != 0 || ps[_D1] 
[| ps[ D2] |! Get D3]) 
{ /* nonzero, scale 
for (; ps [_DO] == 0; xchar -= 16) 
{ /* shift left by 16 
ps [ .D0] = ps[ D1], ps[ D1] = ps[_D2]; 
ps [ D2] ps[. D3], ps(. Däi 0; 
) 
(; ps[ DO] < 1«« DOFF; --xchar) 
f ` /* shift left by 1 
pel DO] = ps[ DO] << 1 | ps[ D1] >> 15; 
ps[ D1] = ps[ D1] << 1 | ps[ D2] >> 15; 
ps[_D2] = ps[ D2] << 1 | ps[ D3] >> 15: 
ps[ D3] ««- 1; 
H 
(; Lee DOFF+1 <= ps[ D0]; ++xchar) 
{ /* shift right by 1 
ps[ D3] pel D3] >> 1 | psi, D2] << 15; 
ps[ D2] pel D2] >> 1 | ps[ D1] << 15; 
pel D1) = ps[ Dl] >> 1 | ps[ DO] << 15; 
ps[ DO] >>= 1; 
) 
ps[ DO] &= 
) 
pel DO] |= sign; 
return (xchar); 


} 


DFRAC ; 
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/* fmod function */ 
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#include "xmath.h" 
double (fmod) (double x, double y) 
( /* compute fmod(x, y) */ 
const short errx = Dtest(&x); 
const short erry = _Dtest(&y); 
if (errx == NAN || erry == NAN || errx == INF || erry == 0) 
{ /* fmod undefined */ 
errno = EDOM; 
return (errx == NAN ? x erry == NAN ? y Nan. D); 
H 
else if (errx == || erry == INF) 
return (x); /* fmod(0, nonzero) or fmod(finite, INF) */ 
else 
( /* fmod(finite, finite) */ 
double t; 
short n, neg, ychar; 
if (y « 0.0) 
y = `Y; 
if (x < 0.0) 
x = -x, neg = 1; 
else 
neg = 0; 
for (t = y, Dunscale(&ychar, &t), n = 0; ;) 


( /* subtract |y| until 
short xchar; 


t = X; 
if (n < 0 || _Dunscale(&xchar, St ) == 0 
|| (n = xchar ~ ychar) < 0) 
return (neg ? -x : X) ; 
for (; 0 «- n; --n) 
H /* try to subtract 
t = y, Dscale(&t, n); 
if (t <= x) 
{ 
x -= t; 
break; 
) 


Ixi«iv| */ 


ly|*20n */ 
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<math.h> 


函数 1dexp 


函数 


. Dunscale 


函数 Dscale 


函数 Dnorm 


图 7-10 显示 了 文件 1dexo.c. RK ldexp 面临 着 和 frexp 相似 的 问题 ， 
只 不 过 它们 的 功能 相反 。 该 函数 一 旦 发 送 了 任何 特殊 的 编码 ， 就 还 要 执行 一 
个 重要 的 任务 。 函 数 也 要 调用 一 个 低级 函数 。 这 两 个 低级 别 的 函数 如 下 所 示 。 

图 7-11 显示 了 文件 xdaunscal.c。 它 定义 了 函数 _punscale， 这 个 函数 
把 Dtest 和 frexp 的 行为 组 合 到 一 起 ， 这 样 ， 其 他 几 个 数学 函数 就 可 以 更 
加 方便 地 使 用 它们 了 。 通 过 调用 _punscale， 函 数 frexp 要 完成 的 工作 就 很 
少 了 。 


在 不 出 现 渐 进 下 溢 的 情况 下 ，_Dunscale 本 身 只 需要 完成 一 个 相当 简单 
的 工作 。 一 个 标准 化 的 值 有 一 个 非 零 的 特征 值 ， 而 且 在 给 出 的 小 数 的 最 高 有 
效 位 的 左边 还 有 一 个 隐藏 的 小 数位 。 一 个 零 特 征 值 和 一 个 前 面 没 有 隐藏 位 的 
非 零 小 数 标志 着 渐进 下 浇 。 这 两 种 形式 都 要 转换 为 区 间 [0.5,1.0) 中 的 一 个 
标准 化 的 小 数 和 一 个 合适 的 二 元 指数 。 下 面 讲 到 的 函数 Dorm 会 处 理 这 种 
繁琐 的 工作 。 


图 7-12 显示 了 文件 xascale.c， 这 个 文件 定义 了 函数 _Dscale。 因 为 它 
可 以 通过 其 他 方式 被 调用 ， 所 以 它 也 会 受到 特殊 编码 的 困扰 。 把 一 个 很 小 的 
få xexp 加 到 一 个 有 限 的 *px 的 指数 上 可 能 会 导致 上 洪 、 渐 进 下 洲 或 者 下 洲 。 
在 形成 新 的 指数 的 时 候 ， 甚 至 要 考虑 到 整数 溢出 。 这 就 是 函数 首先 以 long 类 
型 计算 它们 的 和 的 原因 。 


_Dscale på ALP ARVE -ESEYE T PE NET dk. IG RE SE Bos TR 
—Dnorm 的 反 操 作 。 


图 7-13 显示 了 文件 xdanorm.c， 这 个 文件 定义 了 函数 Dnorm, BRÅ 
渐进 下 溢 的 小 数 部 分 进行 标准 化 并 且 相 应 地 调整 特征 值 。 为 了 提高 性 能 ， 函 
数 在 任何 可 能 的 时 候 会 把 小 数 部 分 一 次 左 移 16 位 。 这 就 是 它 要 准备 好 每 次 不 
仅 左 移 一 位 也 要 右 移 一 位 的 原因 。 有 时 候 它 可 能 会 移 过 头 而 不 得 不 倒 回 来 。 

图 7-14 显示 了 文件 fmod.c, MÅ fmod 是 <math.h> 中 声明 的 半数 值 函 
数 中 的 最 后 一 个 ， 也 是 最 复杂 的 一 个 。 原 则 上 ， 它 重复 地 从 x 的 值 中 减 去 y 
的 值 ， 直 到 剩 下 的 数 比 y 小。 实际 上 ， 这 样 做 花费 的 时 间 很 长 ， 即 使 它 可 以 
保留 任何 精度 ， 这 也 是 不 能 容忍 的 。 


因此 fmod 实际 上 做 的 是 在 每 一 次 减 之 前 都 把 Y 乘 以 2 的 最 大 可 能 的 寡 。 
这 仍然 要 求 很 多 次 的 迭代 ， 但 结果 会 相当 精确 。 注 意 fmod 使 用 Dscale 和 
_Dunscale 操作 指数 的 方式 。 它 使 用 Dunscale 来 提取 x 和 yy 的 指数 以 对 它 
们 的 数值 执行 一 个 快速 但 是 很 粗糙 的 比较 。 如 果 fmod 确定 一 个 减法 能 行 得 
通 ， 它 就 使 用 _Dscale 来 把 x 扩大 到 近似 合适 的 大 小 。 
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函数 sin 


现在 让 我 们 看 看 三 角 函 数 。 图 7-15 显示 了 文件 xsin.c， 该 文件 定义 了 
函数 Sin. MÆ qoff 为 0 函数 就 计算 sin(x); MÅ qoff 为 1， 函数 就 计 
F cos (x) 。 计 算 余 弦 时 使 用 这 样 的 “象限 偏 移 ” 避 免 了 把 mw2 加 到 参数 上 
时 造成 的 精度 丢失 。 在 用 多 项 式 对 三 角 函 数 通 近 时 ， 我 使 用 了 截断 的 泰勒 展 
式 ， 并 且 为 了 改善 逼近 的 误差 分 布 ， 还 使 用 了 切 比 雪夫 多 项 式 对 泰勒 展 式 进 
行 “ 节 约 ”。( 如 果 不 明 和 白 这 是 什么 意思 也 没关系 。) 


把 参数 减 小 到 区 间 [-7/4, m4] 的 时 候 一 定 要 谨慎 。 确 定 应 该 从 参数 中 减 
去 多 少 个 m2 非常 简单 ， 这 样 就 确定 了 qua3， 即 该 角 所 在 的 象限 (位 于 4 个 
轴 其 中 的 一 个 的 中 间 )。 需 要 用 quad + off 的 较 低 的 两 位 来 确定 是 计算 余 
弦 还 是 正弦 以 及 是 否 希 要 对 结果 取 负 。 注 意 将 有 符号 的 象限 转换 为 无 符号 值 
的 方式 ， 这 样 负 参数 在 所 有 的 计算 机 体系 结构 下 就 能 够 得 到 一 致 的 对 待 。 


在 这 一 点 上 要 做 的 是 以 任意 的 精度 计算 quad*m/2。 要 从 参数 中 减 去 这 个 
值 并 且 在 最 高 有 效 位 忽略 后 仍然 具有 完整 的 double 类 型 值 。 由 于 浮 点 值 的 取 
值 范围 很 广 ， 因 此 这 是 一 个 很 高 的 目标 ， 很 难 实现 ， 而 且 也 有 点 轧 幼 。 就 像 
我 在 7.3 节 毛 说 的 那样 ， 参 数 的 数值 越 大 ， 三 角 函 数 就 变 得 越 来 越 粗糙 。 除 
了 某 些 值 之 外 ， 其 他 所 有 的 值 都 不 能 从 12 的 整数 倍 中 区 分 出 来 。 有 些 人 认 
为 这 是 - -种 错误 的 情况 ， 但 是 C 标准 不 这 样 认为 。 循 环 函数 对 所 有 有 限 的 参 
数值 都 要 返回 一 些 有 意义 的 值 ， 并 且 不 能 报告 错误 。 


我 选择 了 把 这 些 区 别 分 开 来 讲 。 通 过 在 某 些 地 方 改编 Cody 和 Waite 使 
用 的 方法 ， 我 把 2 表示 为 “1.5” 倍 的 double 精度 。 头 文件 "xmath-h" 把 
宏 HUGE RAD 定义 为 : 

#define HUGE RAD 3.14e30 
可 以 通过 把 一 个 参数 除 以 m2 来 使 它 达到 这 个 值 ， 然 后 就 可 以 得 到 一 个 能 转 
HA long 类 型 的 值 ， 而 且 不 用 担心 溢出 。 常 数 ci 把 72 的 最 高 有 效 位 表示 
为 double 类 型 ， 当 然 这 个 double 类 型 的 低 32 位 都 是 零 。( 常 数 c2 提供 了 -- 
个 具有 额外 的 精度 的 全 double 值 ) 


这 就 意味 着 可 以 用 一 个 任意 的 long (FE HRA double) RA cl 并 且 得 到 
一 个 精确 的 结果 。 因 此 ， 只 要 参数 的 数值 比 HUGE RAD 小 ， 就 可 以 得 到 全 
duoble 精度 的 缩减 的 参数 。 在 下 面 的 表达 是 中 就 是 如 此 : 

g= (x - g * cl) - g * c2; 
对 于 比 HUGE RAD 大 的 参数 ， 这 个 函数 可 以 简单 地 减 去 2 的 一 个 倍数 。 注 
意 在 分 离 double 值 的 整数 部 分 的 过 程 中 对 _Dint 的 使 用 。 或 者 可 以 说 ,一 日 
参数 比 这 个 值 大 了 很 多 倍 ， 那 么 函数 sin 和 cos 就 不 再 强调 精度 。 我 认为 对 
这 种 很 大 的 参数 考虑 高 精度 就 不 值得 了 。 


<math.h> 


图 7-15 


xsin.c 


/* Sin function */ 
#include "xmath .h" 


/* coefficients */ 


static 


-0. 
0. 
-0. 
0. 


-0 


1 
static 
-0 


-0 
0 


static 
static 
static 
static 


double 
{ 


const double c[8] ={ 
000000000011470879, 
000000002087712071, 
000000275573192202, 
000024801587292937, 


.001388888888888893, 
0. 
-0. 


041666666666667325, 
500000000000000000, 


.0); 


const double s[8] - ( 


.000000000000764723, 
0. 


000000000160592578, 


.000000025052108383, 
.000002755731921890, 
-0. 
0. 
-0. 
1. 


000198412698412699, 

008333333333333372, 

166666666666666667, 

0); 

const double cl - (3294198.0 / 2097152.0); 

const double c2 = (3.139164786504813217e-7]; 
const double twobypi - (0.63661977236758134308); 
const double twopi - (6.28318530717958647693); 


.Sin (double x, unsigned int qoff) 
/* compute sin(x) or cos(x) */ 


switch ( Dtest(&x)) 


{ 


case NAN: 


errno = EDOM; 
return (x); 


case 0: 


return (qoff ? 1.0 : 0.0); 


case INF: 


errno - EDOM; 
return ( Nan. D) ; 


default: ` /* finite */ 
{ /* compute sin/cos */ 
double g; 
long quad; 


if (x < -HUGE_RAD || HUGE_RAD < x) 

{ /* x huge, sauve qui peut */ 
g = x / twopi; 

_Dint(&g, 0); 

x -= g * twopi; 

} 

g = x * twobypi; 

quad = (long) (0 <g ?g + 0.5: g- 0.5); 
doff += (unsigned long) quad & 0x3; 

g = (double) quad; 

g= (x - g * cl) - g * c2; 


图 7-15 
€» 


图 7-16 
xpoly.c 


_Poly 


cos sin 


函数 tan 


函数 Asin 
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if ((g < 0.0 ? -g : g) < Rteps. D) 
{ /* sin (tiny) ==tiny, cos (tiny)==1 */ 
if (qoff & 0x1) 
g = 1.0; /* cos(tiny) */ 
} 
else if (qoff & 0x1) 
g = Poly(g * g. c, 7); 
else 
g *= _Poly(g * g, s, 7); 
return (qoff & 0x2 ? -g : g); 
} 
} 


/* Poly function */ 
#include "xmath.h" 


double _Poly(double x, const double *tab, int n) 


{ /* compute polynomial 
double y; 


for (y = *tab; 0 <= --n; ) 
y = y * x + *++tab; 
return (y); 


) 


Sin 函数 的 其 他 部 分 就 很 简单 了 。 如 果 缩 减 后 的 角 g 充分 小 ， 那 么 计算 
一 个 多 项 式 的 近似 值 就 是 在 浪费 时 间 ; 如 果 缩 减 的 角 确 实 很 小 ， 那 么 计算 乎 
方 参数 gxg 的 时 候 很 可 能 产生 下 溢 。 这 里 ， 当 g*g 小 于 <float. 中 定义 的 
DBL EPSILON 时 ， 就 称 得 上 是 “充分 小 ”。 注意 ， 要 加 速 这 个 测试 ， 要 使 用 


double 常量 Rteps. D, 


图 7-16 显示 了 文件 xpoly.c， 这 个 文件 定义 了 函数 Poly. Å Sin 
使 用 Poly 并 使 用 霍 纳 规则 来 计算 一 个 多 项 式 的 值 。 


图 7-17 显示 了 文件 cos.c， 图 7-18 显示 了 文件 sin.c。 这 些 文件 定义 了 
三 角 函 数 cos 和 sin. KIL «math.h» 为 这 两 个 函数 都 定义 了 屏蔽 宏 。 


图 7-19 显示 了 文件 tan.c。 函 数 tan 和 其 他 的 三 角 函 数 sin 和 cos 非常 
相似 。 它 也 把 它 的 参数 缩减 到 14, r/4] 范围 内 。 主 要 的 区 别 是 函数 在 这 个 
缩减 的 区 间 上 求 近似 值 的 方式 。 因 为 正切 在 n2 的 整数 倍 上 有 极 值 ， 所 以 它 
使 用 多 项 式 的 一 个 比例 来 求 近似 值 会 更 好 。Cody 和 Waite 提供 了 这 些 系 数 。 

现在 考虑 一 下 三 角 函 数 的 反 函 数 。 图 7-20 显示 了 文件 xasin.c， 这 个 文 
件 定 义 了 函数 Asin. WE qoff 是 零 它 就 计算 asin(x)， 如 果 aff 为 1 就 
计算 acos (x) 。 这 就 避免 了 对 acos 的 结果 修改 两 次 。 
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<math.h> 


图 7-17 


COS .C 


图 7-18 


sin.c 


acos asin 


atan atan2 


/* cos function */ 
#include <math.h> 


double (cos) (double x) 
{ 
return (_Sin(x, 1)); 


} 


/* compute cos */ 


a 


/* sin function */ | 
#include <math. h> 


double (sin) (double x 
{ 
return (_Sin(x, 0)); 


} 


/* compute sin */ 


口 


Asin 首先 确定 了 参数 的 数值 Yy。 它 用 5 种 不 同 的 方式 计算 中 间 结 果 
(也 放 在 y 中 )。 


O 如 果 y<_Rteps._D， 就 使 用 参数 本 身 。 
CO Wb, AR y<0.5， 就 使 用 Cody 和 Waite 给 出 的 多 项 式 近似 法 的 一 
个 比例 。 
D 否则， 如 果 y<1.0， 使 用 同样 的 近似 法 来 计算 2*asin(sart (1-x) 
/2)) 《有 效 地 计算 )。 实 际 的 算术 会 尽量 减少 中 间 值 的 有 效 值 丢 失 。 

O TU, WẸ y= =1.0， 使 用 0。 

O 理 旭 ，y>1.0， 子 数 报告 一 个 定义 域 错误 。 

对 这 样 零散 的 方法 ， 人 们 所 关心 的 是 在 边界 处 引入 不 连续 性 。 在 这 种 情 
况 下 ， 最 让 人 担心 的 边界 在 y SF 0.5 的 地 方 。 

在 这 个 过 程 中 ，_Asin 根据 idx 中 的 记号 来 确定 最 终 的 结果 : 

D 如 果 idxs1， 要 求 计 算 的 是 反 余 弦 ， 不 是 反正 弦 ， 

O 如 果 idx&2， 参 数 是 负 的 。 

C) WR idqxg4， 参 数 的 数值 大 于 0.5。 
最 后 的 修正 包括 添加 1/4 的 各 个 整数 倍 和 取 结 果 的 负 值 。 要 进行 阶段 性 求 和 ， 
以 防止 有 效 值 的 丢失 。 

7-21 显示 了 文件 acos.c， 图 7-22 显示 了 文件 asin.c。 这 些 文件 定义 
了 平凡 函数 acos 和 asin。 头 文件 <math.h> AKA SRM MT RAME o 

最 后 一 个 反 三 角 函 数 是 反正 切 ， 它 有 两 种 形式 :atan(x) 和 
atan2 (y, x) 。 这 两 种 形式 都 调用 一 个 公共 的 函数 Atan 来 执行 实际 的 计算 。 
然而 ， 和 前 面 的 三 角 函 数 不 同 ， 这 个 公共 函数 刚 出 现时 并 不 是 最 好 的 选择 。 
图 7-23 显示 了 文件 atan.c。 图 7-24 显示 了 文件 atan2.c， 它 定义 了 函数 
atan2， 这 个 函数 据 示 了 这 3 个 函数 协同 工作 的 原理 。 


Æ 7-19 


tan.c 
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/* tan function */ 
#include "xmath.h" 


/* coefficients, after Cody & Waite, Chapter 9 */ 
static const double p[3] - ( 
-0.17861707342254426711e-4, 
0.34248878235890589960e-2, 
-0.13338350006421960681e+0); 
static const double q[4] = I 
0.49819433993786512270e-6, 
-0.31181531907010027307e-3, 
0.25663832289440112864e-1, 
-0.46671683339755294240e+0); 
static const double cl = (3294198.0 / 2097152.0); 
static const double c2 = {3.139164786504813217e-7}; 
static const double twobypi = (0.63661977236758134308); 
static const double twopi = {6.28318530717958647693}; 


double tan (double x) 


{ /* compute tan(x) */ 
double g, gd; 
long quad; 
switch ( Dtest(&x)) 
{ 
case NAN: 
errno = EDOM; 
return (x); 
case INF: 
errno = EDOM; 
return (_Nan._D) ; 
case 0: 
return (0.0) ; 
default : /* finite */ 
if (X « -HUGE RAD || HUGE, RAD « x) 
H /* x huge, sauve qui peut */ 
g = x / twopi; 
_Dint (&g,0); 
x -= g * twopi; 
} 
g = x * twobypi; 
quad = (long)(0 <g ? g + 0.5 : g- 0.5); 
g = (double) quad; 
g = (xX - g * cl) - g * c2; 
gd = 1.0; 
if ( Rteps. D < (g < 0.0 ? -g : g)) 
{ /* g*g worth computing */ 


double y = g * g; 


gd+= (((g(0] * Y + g[1]) * Y +q(2]) * Y *q[3]) * v; 
g += ((p[0] * Y + p[1]) * Y + p[2]) * Y * g; 
} 

return ((unsigned int)quad & 0x1 ? -gd / g : g / gd); 

) 
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图 7-20 


xasin.c 


/* _Asin function */ 
finclude "xmath.h" 


/* coefficients, 
static const double p[5] = ( 
-0.6967457344735064641le+0, 
0.10152522233806463645e+2, 
-0.39688862997504877339e+2, 
0.57208227877891731407e+2, 
-0.27368494524164255994e+2); 
static const double q[6] = ( 
0.10000000000000000000e+1, 
-0.23823859153670238830e+2, 
0.15095270841030604719e+3, 
-0.38186303361750149284e+3, 
0.41714430248260412556e+3, 


after Cody & Waite, 


-0.16421096714498560795e+3) ; 
static const double piby2 = 
static const double piby4 = 
double _Asin (double x, int idx) 

{ 

double g, y; 

const short errx = _Dtest (&x); 

if (0 « errx) 

( 

errno - EDOM; 

return (errx -- NAN ? x 
} . 

if (x « 0.0) 

y = -x, idx |- 2; 
else 

Y = X; 
if (y < Rteps. D) 
else if (y « 0.5) 


{ 
g=y*y; 

y += y * g * _Poly(g, p, 
} 


else if {y < 1.0) 
{ 


idx |= 4; 
g = (1.0 - y) / 2.0; 
Y = sqrt (g) ; 
y += Y; 
yY += y * g *  Poly(g, p. 
} 
else if (y == 1.0) 
idx |= 4, y = 0.0; 
else 
{ 
errno = EDOM; 
return (_Nan._D); 


4) 


4) 


Chapter 10 */ 


{1.57079632679489661923) ; 
{0.78539816339744830962) ; 


/* compute asin(x) or acos(x) 


/* INF, NaN 


Nan._D); 


/* y*y worth computing 


/ _Poly(g, q, 5); 


/* find 2*asin(sqrt((1-x)/2)) 


/* NOT * 0.5! 


/ Polylg, q, 5); 


/* 1.0 < |x|], undefined 


*/ 


*/ 


*/ 


*/ 
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图 7-20 
( 续 ) 


图 7-21 


acos.c 


图 7-22 


asin.c 


FE DSIGN 


) 
switch (idx) 
{ /* flip and fold */ 


default: /* shouldn't happen */ 
case 0: /* asin, [0, 1/2) */ 
case 5: /* acos, (1/2, 1] */ 
return (y); 
case 1: /* acos. [0, 1/2) */ 
case 4: /* asin, (1/2, 1] */ 
return ((piby4 - y) + piby4); 
case 2: /* asin, [-1/2, 0) */ 
return (-y) 
case 3: /* acos, [-1/2, 0) */ 
return ((piby4 + y) * piby4); 
case 6: /* asin, [-1, -1/2) */ 
return ((-piby4 + y) - piby4); 
case 7: /* acos, [-1, -1/2) */ 
return ((piby2 - y) * piby2); 
H 
H [mi 
/* acos function */ 
finclude <math.h> 
double (acos) (double x) 
{ /* compute acos(x) */ 
return (_Asin(x, 1)); 
) D 


/* asin function */ 
#include «math.h» 


double (asin) (double x) 
{ /* compute asin(x) */ 
return (_Asin(x, 0)); 
} 口 


正如 我 们 看 到 的 ， 函 数 atan 仅仅 提供 了 atan2 所 固有 的 功能 的 一 
个 子 集 。 那 是 因为 atan(y) 等 价 于 atan2(y,1.0)。 顺 便 说 一 下 ， 头 文件 
"xmath.h" 对 宏 DSIGN 的 定义 如 下 ; 

define DSIGN(x) ( ( [D0] & | DSIGN) 
该 宏 用 来 检查 一 个 特殊 编码 〈 例 如 Inf》 的 符号 位 ， 这 在 --- 个 正常 的 表达 式 中 
可 能 不 太 好 测试 。 在 任何 这 样 的 特殊 编码 可 能 出 现 的 地 方 ， 我 都 使 用 DSIGN 
来 检测 符号 位 。 

atan2 首先 检查 它 的 参数 是 否 为 各 种 特殊 编码 。 它 接受 任意 定义 了 以 原 
点 为 端点 的 半径 向 量 的 方向 的 一 对 数 。( 对 atan2 (0,0) 的 处 理 是 有 争议 的 ， 
在 专家 建议 的 基础 上 ， 我 选择 了 返回 零 . )。 然 后 函数 确定 Atan 的 两 个 参数 
z 是 缩减 到 区 间 [0,1] 的 正切 参数 。hex 把 圆 等 分 为 16 份 : 


(unsigned short *) & (x) ) 
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<math.h> 


图 7-23 
atan.c 
函数 Atan 


/* atan function */ 
include "xmath.h" 


double (atan) (double x) 
{ /* compute atan(x) */ 
unsigned short hex; 
static const double piby2 = (1.57079632679489661923); 


switch ( Dtest(&x)) 

{ /* test for special codes */ 
case NAN: 

errno = EDOM; 

return (x); 


case INF: 
return (DSIGN(x) ? -piby2 : piby2); 
case 0: 
return (0.0); 
default: /* finite */ 
if (x « 0.0) 
x = -x, hex = 0x8; 
else 
hex 0x0; 


if (1.0 « X) 
1.0 / x, hex ^= 0x2; 

return (_Atan(x, hex)); 

} 


x = 


D 如 果 hex&0x8， 取 结果 的 负 值 。 

O 如 果 hex&Ox4, z 的 正切 值 加 上 ai, 
O 如 果 hex&Ox2, n/4 MA z 的 正切 值 。 
O 如 果 hexs0x1, z DIE DIS ae, 


RA Atan 设置 最 低 有 效 位 ， 来 表明 2 的 初始 值 大 于 2-3% (KA 0.268)。 
它 用 下 面 的 表达 式 来 代替 z: 

(z*sqrt (3) -1) /sart (3) +z) 
所 有 这 些 技巧 者 源 自 各 种 三 角 恒 等 式 ， 这 些 三 角 恒 等 式 用 来 缩减 近似 值 的 范 
围 。 


图 7-25 显示 了 文件 xatan.c， 这 个 文件 定义 了 函数 _Atan。 因 为 它 只 能 
被 函数 atan 和 atan2 调用 ， 所 以 ， 它 只 检查 其 参数 x 是 否 需 要 减 小 到 比 2-37 
小 。 如 果 减 小 后 的 参数 的 数值 比 _Rteps._D 小 ， 那 么 它 就 作为 正切 的 近似 
f. AU, IB Cody 和 Waite 提供 的 多 项 式 的 比例 。 函 数 加 上 表 a 中 的 
一 个 元 素来 处 理 上 面 描述 的 所 有 的 常数 的 加 法 和 减法 。 
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图 7-24 /* atan2 function */ 
atan2.c #include "xmath.h" 


double (atan2) (double y, double x) 


{ /* compute atan(y/x) */ 
double z; 

const short errx -  Dtest(&x); 

const short erry -  Dtest(&y); 


unsigned short hex; 


if (errx <= 0 66 erry «- 0) 


( /* x 6 y both finite or 0 */ 
if (y « 0.0) 
y = -y, hex - 0x8; 
else 
hex - 0x0; 
if (x « 0.0) 
x = -x, hex ^- 0x6; 
if (x < y) 
| z-2x/ y, hex ^= 0x2; 
else if (0.0 « x) 
z-y/X 
else 
return (0.0) ; /* atan(0, 0) */ 
H 
else if (errx -- NAN || erry -- NAN) 
( /* return one of the NaNs */ 
errno - EDOM; 
return (errx -- NAN ? x : y); 
H 
else 
{ /* at least one INF */ 
z = errx == erry ? 1.0 : 0.0; 


hex = DSIGN(y) ? 0x8 : 0x0; 
if (DSIGN(x)) 
hex ^= 0x6; 
if (erry == INF) 
hex ^- 0x2; 
} 
return (_Atan(z, hex)); 


a 


函数 sart BEA AAK EAT SHR. o Bm. 87-26 显示 了 文件 
sart.c, MÅ sart 计算 它 的 参数 x 的 平方 根 ， 或 者 xz。 它 使 用 _punscale 
把 一 个 有 限 的 正 数 x 分 为 一 个 指数 e 和 一 个 小 数 1 两 部 分 。 参 数值 就 是 了 *2“， 
其 中 f 在 区 间 [0.5,1.0] 内 ， 那 么 它 的 平方 根 就 是 f 1? 277, 
这 个 函数 首先 计算 一 个 适合 f” 的 一 个 二 次 最 小 二 乘 拟 合 。 它 然后 3 次 
应 用 牛顿 法 一 一 除法 和 求 均值 一 一 来 获得 需要 的 精度 。 注 意 函 数 是 怎样 把 算 
法 的 最 后 两 次 迭代 合并 以 提高 它 的 性 能 攻 


AF =a 
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图 7-25 /* Arten function */ 
xatan.c #include "xmath.h" 


/* coefficients, after Cody 6 Waite, Chapter 11 */ 

static const double a[8] - ( 
0.0, 

.52359877559829887308, 

.57079632679489661923, 

.04719755119659774615, 

.57079632679489661923, 

.09439510239319549231, 

.14159265358979323846, 

2.61799387799149436538) ; 

Static const double p[4] = ( 
-0.83758299368150059274e+0, 
-0.84946240351320683534e+1, 
-0.20505855195861651981e+2, 
-0.13688768894191926929e42) ; 

static const double q[5] = { 
0.10000000000000000000e+1, 
0.15024001160028576121e+2, 
0.59578436142597344465e+2, 
0.86157349597130242515e+2, 
0.41066306682575781263e+2); 

static const double fold = (0.26794919243112270647) ; 

static const double sqrt3 = (1.73205080756887729353); 

static const double sqrtàiml = (0.73205080756887729353); 


WNPRPRO 


double _Atan(double x, unsigned short idx) 


{ /* compute atan(x), 0 <= x <= 1.0 */ 
i f (fold < x) 
{ /* 2-sqrt (3) < x */ 
x = (((sqrt3ml * x - 0.5) - 0.5) + x) / (sqrt3 + x); 
idx |= 0x1; 
} 
if (X < - Rteps. D || _Rteps._D < x) 
{ /* x*x worth computing */ 


const double g = x * x; 


x += x * g / _Poly(g, q, 4) 
* (((pI0] * g + p[1]) * g + p[2]) * g + pl31); 


} 
if (idx 6 0x2) 
X = -Xi 
x += a[idx 6 07]; 
return (idx 6 0x8 ? -x : x); 


) 
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图 7-26 /* sqrt function */ 
sqrt.c #include «limits. h> 
#include "xmath. h" 


double (sqrt) (double x) 


{ /* compute sqrt(x) */ 
short xexp; 


switch ( Dunscale(&xexp, &x)) 
{ /* test for special codes */ 
case NAN: 
errno = EDOM; 
return (x); 
case INF: 
if (DSIGN(x)) 
{ /* -INF */ 
errno = EDOM; 
return (_Nan._D); 


} 
else 
{ /* +INF */ 
errno = ERANGE; 
return (_Inf._D); 
} 
case 0: 
return (0.0); 
default: /* finite */ 
if (x « 0.0) 
{ /* sqrt undefined for reals */ 
errno = EDOM; ‘ 
return (_Nan._D) ; 
} 
{ /* 0 < x, compute sqrt(x) */ 
double y; 


static const double sqrt2 = {1.41421356237309505}; 


y = (-0.1984742 * x + 0.8804894) * x + 0.3176687; 
y=0.5 * (y+ x / y) 

yt= x / yi 

x= 0.25 * y+x/y; 

if ((unsigned int)xexp & 1) 


x *- sqrt2, --xexp; 
_Dscale(&x, xexp / 2); 
return (x): 

) 
) 


<math.h> 


/* Exp function */ 
#include "xmath.h" 


/* coefficients, after Cody & Waite, Chapter 6 */ 

static const double p[3] = ( 
0.31555192765684646356e-4, 
0.75753180159422776666e-2, 
0.25000000000000000000e+0); 

static const double q{4] = ( 
0.75104028399870046114e-6, 
0.63121894374398503557e-3, 
0.56817302698551221787e-1, 
0.50000000000000000000e+0}; 

static const double cl = (22713.0 / 32768.0}; 

static const double c2 = (1.428606820309417232e-6]; 

static const double hugexp = ((double)HUGE EXP); 

static const double invln2 = {1.4426950408889634074}; 


f 


Short  Exp(double *px, short eoff) 
( /* compute e^(*px)*2^eoff, x finite */ 
int neg; 


if (*px « 0) 


*px = -*px, neg = 1; 
else 
neg = 0; 
if (hugexp « *px) 
{ /* certain underflow or overflow */ 


*px = neg ? 0.0: Inf. D; 
return (neg ? 0:INF); 
) 


else 
{ /* xexp won't overflow */ 
double g = *px *invln2; 
short xexp = (short) (g + 0.5); 


g = (double) xexp; 


g = (*px - g * cl) - g * c2; 
if (-_Rteps._D < g && g < Rteps. D) 
*px = 1.0; 
else 
{ /* g*g worth computing */ 


const double y=oq* g; 


g *- (p[0] * y + P[1]) * y + pl2]; 


*px= 0.5 + g / (((al0] * y+ al1]) * y + a[2]) * y 
+ qgl3] - g); 
++XEXp; 
} 
if (neg) 
*px = 1.0 / *px, xexp = -xexp; 


return (_Dscale(px, eoff + xexp)); 


} 
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函数 Exp 


Zi HUGE EXP 


函数 exp 


函数 cosh 


BE sinh 


图 7-27 显示 了 文件 xexp.c， 这 个 文件 定义 了 函数 Exp. AEE 
计算 一 个 有 限 参 数 的 指数 ， 或 者 e* 。 很 多 这 样 的 函数 实际 上 需要 计算 ex/2。 
在 这 种 情况 下 ， 参 数 eoff 是 -1。 只 有 在 e” 12 发生 溢出 时 结果 才 会 溢出 。 

头 文件 "xmath.h" 把 宏 HUGE EXP 定义 为 下 面 精心 设计 的 值 : 

#define HUGE EXP (int) ( DMAX * 900L / 1000) 

这 个 值 在 所 有 已 知 的 浮 点 数 表示 中 ， 大 到 可 以 造成 溢出 。 在 以 下 的 计算 中 ， 
它 也 可 以 足够 小 但 不 至 于 造成 整数 游 出。 因此 ，HUGE_EXP 对 Exp 的 那些 实 
际 上 没有 意义 的 参数 提供 了 一 个 粗略 的 过 滤 。 


这 里 用 到 技巧 的 地 方 是 计算 In(2) 除 以 x， 假 设 商 为 y»， 然 后 求 2 的 y 
UE. MADEIRA. (Sim, gå NR E [-0.5,0.5] 内 。 然 后 用 


_Dscale 函数 在 其 结尾 处 把 整数 部 分 〈 加 上 eof) 加 上 去 。 该 函数 也 可 以 安 


Seth Ab BETA AY Etat ATF it» 


通过 这 种 方式 减 小 参数 ， 会 遇 到 很 多 和 前 面 讲 过 的 减 小 Sin 和 tan 的 
参数 相同 的 问题 。 这 里 的 优势 是 可 以 选择 扩展 精度 的 常数 cl 和 c2 来 为 所 有 
合理 的 参数 值 表 示 LUln(2)。 


和 以 前 一 样 ， 减 小 的 参数 通过 和 Rteps. D 比较 来 避免 下 游 和 不 必要 的 
计算 。 多 项 式 的 比例 系数 还 是 来 源 于 Cody 和 Waite。 近 似 值 实际 计算 25/2, 
因此 需要 对 xexp 进行 修正 。 


图 7-28 显示 了 文件 exp.c. PR exo 在 调用 带 一 个 有 限 参 数 的 _Exp 之 
前 检查 它 的 参数 是 否 为 特殊 编码 。 然 后 它 检 测 返 回 值 是 否 为 零 或 者 无 穷 大 ， 
来 决定 是 否 报告 值 域 错误 。 

图 7-29 显示 了 文件 cosh.c。 函 数 cosh 除了 检查 它 的 参数 是 否 为 特殊 编 
码 和 调用 _Esp， 基 本 上 没什么 其 他 事情 了 。 因 为 函数 的 值 不 论 是 通过 什么 方 
式 计 算出 来 的 ， 都 取决 于 exp (x) /2: 

O 如 果 x« Xbig. D， 那 么 函数 值 就 是 (exp (x)+exp(-x))/2。 这 种 形 

式 去 掉 了 第 二 个 函数 调用 和 -- 些 算术 运算 。 

O 和 否则， 函数 值 是 直接 从 _Exp 获得 的 exp (x) /2。 如 果 _Exp (x, -1) 发 

^E f Hit. PAX cosh 也 必须 报告 值 域 错误 。 

图 7-30 显示 了 文件 sinh.c, MÅ sinh 也 是 根据 Exp 来 计算 定义 域 的 
大 部 分 的 值 。 但 是 和 cosh 不 - - 样 ， 它 是 一 个 奇 函数 。 当 参数 的 数值 小 于 1.0 
时 ， 常 规 的 定义 (exp (x) -exp(-x) ) /2 就 会 丢失 精度 。 在 这 个 区 间 上 ， 最 好 
用 多 项 式 的 一 个 比例 值 来 求 函 数 的 近似 值 ， 这 还 是 源 于 Cody 和 Waite DI Dr 
法 。 和 往常 一 样 ， 如 果 x 的 数值 比 _Rteps._D 小 ， 参 数值 本 身 就 是 函数 值 的 
一 个 合适 的 近似 值 。 


/* compute exp(x) */ 


/* test for special codes */ 


/* finite */ 


/* compute cosh(x) */ 


/* test for special codes */ 


/* finite */ 


/* x large */ 
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图 7-28 /* exp function */ 
exp.c include "xmath.h" 
double (exp)(double x) 
{ 
Switch ( Dtest(&x)) 
( 
case NAN: 
errno - EDOM; 
return (x); 
case INF: 
errno - ERANGE; 
return (DSIGN(x) ? 0.0 Inf. D); 
case 0: 
return (1.0); 
default: 
if (0 <=  Exp(&x,0)) 
errno = ERANGE; 
return (x); 
H 
) 
图 7-29 /* cosh function */ 
cosh.c #include "xmath.h" 
double (cosh) (double x) 
{ 
switch (_Dtest (&x) ) 
{ 
case NAN: 
errno = EDOM; 
return (x); 
case INF: 
errno = ERANGE; 
return (_Inf._D); 
case 0: 
return (1.0); 
default: 
if (x < 0.0) 
x = -X; 
if (0 <= Exp(&x, -1)) 
errno - ERANGE; 
else if (x <  xbig. D) 


x += 0.25 / x; 
return (x); 


} 


7.4 <math.h> 的 实现 163 


图 7-30 
sinh.c 


/* sinh function */ 
#include "xmath.h" 


/* coefficients, after Cody & Waite, Chapter 12 */ 
Static const double p[4] = ( 
-0.78966127417357099479e+0, 
-0.16375798202630751372e+3, 
-0.11563521196851768270e+5, 
-0.35181283430177117881e46); 
Static const double q[4] = { 
1.0, 
-0.27773523119650701667e+3, 
0.36162723109421836460e+5, 
-0.21108770058106271242e+7); 


double (sinh) (double x) 


{ /* compute sinh(x) */ 
switch ( Dtest(&x)) 

{ /* test for special codes */ 
case NAN: 


errno = EDOM; 
return (x); 
case INF: 
errno = ERANGE; 
return (DSIGN(x) ? -_Inf._D : _Inf._D); 
case 0: 
return (0.0); 
default: /* finite */ 
{ /* compute sinh(finite) */ 
short neg; 


if (x < _Rteps._D) 


else if (x < 1.0) 
{ /* |x| < 1 */ 
const double y = x * x; 


X += X * y ` 
* (((p[0] * y + pl11) * y + p[2]) * y + pÅ3]) 
/ (((ql0] * y + qill) * y + a[2]) * y + qg[3]); 
} 
else if (0 <= _Exp(&x, -1)) 
errno = ERANGE; /* x large */ 
else if (x < _xbig._D) 
x -= 0.25 / x; 
return (neg ? -x : x); 
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<math.h> 


函数 tanh 


函数 log 


函数 Log 


log10 


Å E pow 


图 7-31 显示 了 文件 tanh.c. MÅ tanh 在 很 多 方面 和 sinn 都 很 相似 。 
有 一 点 不 同 就 是 它 不 会 游 出 。 当 函数 的 参数 x 的 数值 增 大 时 ， 函 数值 可 以 达 
到 土 1.0。《〈 这 个 函数 可 以 和 cosh 和 sinh 一 样 把 x 和 _Rteps._D 相 比较 。 然 
而 ， 返 回 给 Exp 的 溢出 编码 可 当 作 一 个 有 效 的 提示 。)》 其 他 的 区 列 就 在 函数 
选择 改变 比例 多 项 式 近似 法 的 地 方 。 这 里 使 用 的 和 Cody 和 Waite 的 不 同 ， 小 
于 my KA 0.549) 的 x 的 数值 是 精确 的 。 


图 7-32 显示 了 文件 10g.c。 它 通过 调用 _Log (x, 0) 来 计算 1og(x) 。 很 
自然 地 ， 头 文件 <math.n> 为 这 个 函数 提供 了 一 个 屏蔽 宏 。 这 看 起 来 没什么 
用 ， 但 它 却 是 为 10910 (下 面 将 要 讲 到 ) 提供 屏蔽 宏 的 最 安全 的 方式 。 


图 7-33 显示 了 文件 xlog.c， 这 个 文件 定义 了 函数 _Log。 这 个 函数 使 用 
以 前 在 Exp 中 使 用 的 技巧 来 计算 自然 对 数 ， 只 不 过 反 过 来 了 。 这 种 方法 是 
使 用 _punscale 函数 去 掉 二 元 指数 e， 剩 下 小 数 部 分 大 BYES *2“， 在 这 
里 /在 区 间 [0.5,1.0] 内 。 可 以 先 计算 f2* 的 以 2 为 底 的 对 数 得 到 log, (f) + e 
然后 将 其 乘 以 In(2) 得 到 最 终结 果 。 


这 种 方法 要 求 一 些 很 精细 的 设计 。Cody 和 Waite 提出 的 近似 法 要 求 / 
在 区 间 [0.57, 2.071 A. MRS (实际 的 x〉 太 小 ， 就 要 把 它 加 倍 然 后 修正 
e(Xxexp)。 同 时 还 要 引入 一 个 新 的 变量 z= (f-DA(f+l)， 把 两 种 操作 结合 起 来 
并 消除 那些 可 能 会 造成 精度 丢失 的 步骤 会 更 好 。 近 似 值 仍然 是 多 项 式 的 另 一 
个 比例 。 注 意 ， 它 实际 上 计算 的 是 自然 对 数 。 所 以 在 求 和 之 前 ， 只 需要 改变 
xexp 的 大 小 。 


求 和 时 一 定 要 非常 小 心 ， 至 少 对 接近 零 的 对 数 要 如 此 ， 这 是 _Exp 中 的 
参数 缩减 所 产生 的 另 一 个 问题 。 这 两 个 函数 都 使 用 和 In(2) 相同 的 扩展 精度 表 
示 。 这 里 ， 在 最 后 的 结果 中 ， 较 小 的 部 分 先 和 尽 可 能 多 的 转换 常数 的 低位 拼 
接 起 来 ， 然 后 才 是 较 大 的 那 一 部 分 。 


图 7-34 显示 了 文件 1og10 .c。 它 通过 调用 Log 并 将 其 结果 乘 以 oe, Je? 
来 计算 以 10 为 底 的 对 数 。 发 生 在 Log 内 部 的 乘法 仅仅 是 为 了 得 到 一 个 有 限 
的 结果 。 


图 7-35 显示 了 文件 pow.c。 计 算 关 的 Y 次 圭 的 函数 pow， 很 自然 地 成 了 
所 有 数学 函数 中 最 复杂 的 一 个 。 它 必须 处 理 很 多 特殊 情况 ， 也 必须 设法 为 各 
种 参数 值 计 算出 精确 的 结果 。 


到 现在 为 止 ， 你 应 该 意识 到 计算 exp (y*log(x)) 中 的 危险 了 。 可 以 简 
单 地 把 表示 x 的 指数 的 对 数 偏 移 若干 个 小 数位 作为 它 的 整数 部 分 。 乘 以 y 可 
6 会 使 情况 变 得 更 糟 。 指 数 会 使 这 些 整 数位 再 次 回 到 指数 位 位 置 ， 但 是 损害 
已 经 发 生 了 。 除 非 可 以 使 用 中 间 计 算 来 提高 精度 ， 否 则 在 这 个 过 程 中 必须 丢 


图 7-31 
tanh.c 


/* tanh function */ 
#include "xmath.h" 


/* coefficients, 
Static const double p[3] = { 
-0.96437492777225469787e+0, 
-0.99225929672236083313e+2, 
-0.16134119023996228053e44); 
Static const double q[4] - ( 
0.10000000000000000000e+1, 
0.11274474380534949335e+3, 
0.22337720718962312926e+4, 
0.48402357071988688686e+4) ; 
Static const double ln3by2 = 


after Cody & Waite, 


double (tanh) (double x) 
{ 
switch (_Dtest(&x) ) 
{ 
case NAN: 
errno = 
return 
case INF: 
return 
case 0: 
return (0.0); 
default: 
{ 


short 


EDOM; 
(x): 


(DSIGN(x) ? -1.0 


if (x < 
xX = 
else 
neg 
(x < 


= 0; 

if _Rteps._D) 

else if 
{ 


const double g = x * x; 


(x < In3by2) 


x += x * g * 


/ (((qI0] 


((pE01 
* g + glil) 
} 
else if 
x = 
else 
x = 


(_Exp(&x, 0) 
1.0 - 2.0 / 


< 0) 


1.0; 


return (neg ? -x x); 


Chapter 13 */ 


(0.54930614433405484570) ; 


1.0); 


* g + pí1]) 


(x * x + 1.0); 
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/* compute tanh(x) 


/* test for special codes 


/* finite 
/* compute tanh(finite) 


/* x tiny 


/* [xl < 1n(3)/2 


* g + pl2]) 
* g + q(21) * g + q[3]); 


/* x large */ 
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/* log function */ 
log.c #include <math.h> 


double (log) (double x) 


{ /* compute in(x) */ 
return (_Log(x, 0)); 
} 口 


图 7-33 /* _Log function */ 
xlog.c #include "xmath.h" 


/* coefficients, after Cody & Waite, Chapter 5 */ 
Static const double p[3] = ( 
-0.78956112887491257267e+0, 
0.16383943563021534222e+2, 
-0.64124943423745581147e+2) ; 
static const double q[3] = I 
-0.35667977739034646171e+2, 
0.31203222091924532844e+3, 
-0.76949932108494879777e+3) ; 
static const double cl = (22713.0 / 32768.0); 
Static const double c2 - (1.428606820309417232e-6) ; 
Static const double loge - 0.43429448190325182765; 
Static const double rthalf - (0.70710678118654752440); 


double  Log(double x, int decflag) 
{ /* compute In(x) */ 
short xexp; 


switch (_Dunscale(&xexp, &x)) 
{ /* test for special codes */ 
case NAN: 
errno = EDOM; 
return (x); 
case INF: 
if (DSIGN(x)) 
{ /* -INF */ 
errno - EDOM; 
return ( Nan. D); 


) 


else 
t /* INF */ 
errno - ERANGE; 
return ( Inf. D); 
H 
case 0: 
errno - ERANGE; 
return (- Inf. D); 
default: /* finite */ 
if (x « 0.0) 
H /* ln(negative) undefined */ 
errno - EDOM; 


return (_Nan._D); 


) 
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Æ 7-33 else 


GE) ( /* 1/2 <= x < 1 */ 
double z = x - 0.5; 
double w; 


if (rthalf « x) 


z= (z- 0.5) / (x * 0.5 + 0.5); 

else 
{ /* x <= sqrt(1/2) */ 
=-Xexp; 
z /= (Z * 0.5 + 0.5); 
) 

w= Z* Z; 

Zz += Z * w * ((p[0] * w+ p[1]) * w + p[2]) 
/ (((w + q[0]) * w+ a[1]) * w+ q[2]); 

if (xexp != 0) 
{ /* form z += 1n2 * xexp safely */ 
const double xn = (double)xexp; 
z= (xn * C2 + z) + xn * cl; 
) 

return (decflag ? loge * z : z); 

} 

} 
} 口 


图 7-34 /* log10 function */ 
logi0.c #include «math.h» 


double (10g10) (double x) 


{ /* compute logl0(x) */ 
return (_Log(x, 1)); 
} 口 


失 某 些 有 效 位 。pow 的 这 种 实现 有 效 地 保持 了 这 种 扩展 精度 ， 而 无 需 借助 比 
double 有 更 多 位 数 的 数据 类 型 。 


这 个 函数 的 前 半 部 分 简单 地 对 参数 值 的 各 种 组 合 进行 整理 。 或 者 x 是 
零 ， 或 者 至 少 有 一 个 参数 是 Inf 或 者 NaN。 我 已 经 设计 了 一 种 具有 启发 作用 
的 方法 来 把 这 些 情况 列 成 表格 。 以 后 我 们 必须 跟踪 这 段 代 码 来 看 看 它 是 怎样 
处 理 各 种 各 样 的 组 合 的 ， 这 里 我 再 一 次 采纳 了 专业 人 士 的 建议 。C 标准 对 此 
并 没有 提供 什么 指导 。 


顺便 说 一下， 你 可 能 会 注意 到 函数 是 如 何 调用 _Dint (&y,-1) 来 确定 存 
储 在 double 类 型 的 y 中 的 整 值 是 偶数 还 是 奇数 的 。 此 时 ，_Dint 清空 了 y 的 
整数 部 分 的 最 低 有 效 位 。 如 果 它 清空 的 位 初始 时 是 非 零 的 ， 它 就 返回 一 个 负 
Di FINITE 编码 。 在 函数 pow 的 后 面 的 部 分 也 会 有 一 个 相似 的 检测 。 


/* pow function */ 
include "xmath.h" 


double (pow) (double x, double y) 


{ 

double yi = y; 
double yx, z; 

short n, xexp, zexp; 


short neg = 0; 

short errx = _Dunscale(&xexp, 
const short erry = _Dint (&yi, 
static const short shuge = 
static const double dhuge = 
Static const double 1n2 = 
Static 


&x); 
0); 


if (0 <= errx || 0 < erry) 


(HUGE EXP); 
((double)HUGE EXP); 
(0.69314718055994530942); 
const double rthalf - (0.70710678118654752440); 


/* compute x^y */ 


{ /* x == 0, INF, NAN; y == INF, NAN */ 
z = _Nan._D; 
if (errx == NAN || erry == NAN) 
Z = errx == NAN ? x y, errx = NAN; 
else if (erry == INF) 
if (errx == INF) /* INF^INF */ 
errx - INF; 
else /* OTINF, finite^INF */ 
errx - xexp «- 0 ? (DSIGN(y) ? INF 0) 
: Xexp == 1 && (x == 0.5 || x == -0.5) ? NAN 
(DSIGN(y) ? 0 : INF); 
else if (y -- 0.0) 
return (1.0); /* x^0, x not a NaN */ 
else if (errx == INFY 
{ /* INF*finite (NB: erry tests y fraction) */ 
errx = y « 0.0? 0 INF; 
neg = DSIGN(x) && erry == 0 && Dint(&y, -1) < 0; 
} 
else /* O^finite */ 
errx -y « 0.0 ? INF : 0; 
if (errx == 0) 
return (0.0); 
else if (errx == INF) 
{ /* return -INF or INF */ 
errno = ERANGE; 
return (neg ? - inf. D .Inf. D); 
) 
else 
{ /* return NaN */ 
errno = EDOM; 
return (zi: 
} 
} 
if (y == 0.0) 
return (1.0); 
if (0.0 < x) 


neg = 0; 
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else if (erry < 0) 
{ 


errno = 


/* negative*fractional */ 
EDOM; 


return (_Nan._D); 


} 


else 
X = -x, neg = Dint(&yi, -1) < 0; 
if (X < rthalf) 
x *= 2.0, --xexp; /* -sqrt(.5) <= x <= sqrt(.5) */ 
n= 0, yx = 0.0; 
if (y <= -dhuge) 
zexp = xexp < 0 ? shuge xexp == D ? 0 -shuge; 
else if (dhuge <= y) 
zexp = xexp < 0 ? -shuge xexp == 0? 0 shuge; 
else 
{ /* y*log2(x) may be reasonable */ 
double dexp = (double) xexp; 
long zl = (long) (yx = y * dexp); 
if (zl != 0) 
{ /* form yx = y*xexp-zl carefully */ 
yx = y, _Dint (&yx, 16); ` 
yx = (yx * dexp - (double)zl) + (y - yx) * dexp; 
} . 
yx *- ln2; 
Zexp - zl <= -shuge ? -shuge zl < shuge ? zl shuge; 
if ((n = (short)y) « -SAFE EXP || SAFE EXP « n) 
n= 0; 
} 
{ /* compute z = xfrac^n * 2^yx * 2^zexp */ 
z = 1.0; 
if (x != 1.0} 
{ /* z *= xfrac^n */ 
if ((yi = y - (double)n) != 0.0) 
yx += log(x) * yi: 
if (n < 0) 
n = -n; 
for (yi - x; ; yi *- yi) 
( /* scale by x^2^n */ 
if (n & 1) 
z *- yi; 
if ((n >>= 1) == 0) 
break; 
H 
if (y « 0.0) 
z= 1.0 / a; 
) 
if (yx != 0.0) /* z *= 2^yx */ 
z = Exp(&yx, 0) < 0 ? zk yx : yx; 
if (0 <= Dscale(&z, zexp)) /* Z *- z^zexp */ 
errno - ERANGE; /* underflow or overflow */ 
return (neg ? -z z): 


) 
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SÉ SAFE EXP 


其 他 函数 


函数 Dtento 


函数 的 后 半 部 分 计算 x 和 y 为 有 限 值 时 的 必 。 开 始 的 时 候 ， 它 把 x 重 写 
为 1*2， 这 里 f 在 区 间 [0.512 2.077] Å. WR N 是 最 大 的 可 表示 的 double 类 
型 的 指数 的 数值 ， 那 么 ， 就 可 以 计算 的 N 次 寡 而 不 用 担心 溢出 。 结 果 的 指 
数 的 值 不 会 超过 N/2。 头 文件 "xmath.h" 把 宏 SAFE EXP 定义 为 : 

#define SAFE-EXP (-DMAX>>1) 


pow 使 用 这 个 值 仅仅 是 为 了 这 样 的 一 个 检查 。 


也 可 以 把 达 重 写 为 .请 *2”， 然 后 把 乘积 ery 分 成 一 个 整数 加 一 个 小 数 ， 
或 者 ntg， 这 里 g 在 区 间 (-1,1) 的 范围 内 。 现 在 可 以 把 函数 重新 写 为 : 


XS (f? 29)*2n 
我 故意 将 中 间 的 两 项 组 成 一 组 ， 这 样 就 把 问题 简化 为 了 3 项 的 乘积 ; 


O /" 是 一 个 用 f 乘 以 它 自己 |n| 次 的 循环 。 如果 是 负 的 ， 结 果 就 被 1 
Ro RE |n| HE SAFE_EXP 小 ， 结 果 就 不 会 上 溢 或 者 下 溢 ， 前 面 已 经 说 
明了 其 中 的 原因 。 

D (15% 25) MLE -nrin f) + g*in(2) 的 指数 来 求 值 。 该 求 和 算式 
中 的 两 项 都 很 小 ， 所 以 在 加 法 或 者 求 暴 的 过 程 中 不 会 出 现 严 重 的 精度 
ER. “4K |n| 大 于 SAFE EXP MH GLIR AL. FEIE FR, RAGE 
n《 在 代码 中 也 表示 为 n) 设置 为 零 并 且 不 再 关心 精度 的 问题 。 不 管 y 
Qi)» 有 多 大 ， 结 果 都 不 会 发 生 溢出 。 如 果 指 数 没有 溢出 ， 那 么 ， 无 
论 如 何 ， 最 后 的 结果 大 概 就 由 这 个 项 来 决定 了 。 

O 2" 是 对 Dscale 的 一 次 简单 的 调用 。 

这 个 计算 过 程 最 复杂 的 地 方 就 在 于 避免 上 溢 和 下 洲 ， 其 次 就 是 把 exy 分 

为 n 和 g 的 和 。 注 意 这 里 对 _Dint 的 使 用 是 另 一 种 方式 。 该 方式 使 用 yx 来 
提高 精度 ， 从 而 让 你 在 y 中 保留 额外 的 16 位 精度 。 这 样 就 弥补 了 划分 期 间 
精度 的 丢失 。 这 个 实现 所 支持 的 最 大 的 浮 点 指数 被 假定 不 超过 14 位 ， 因 此 
这 种 划分 应 该 在 所 有 可 表示 的 值 的 范围 内 都 很 安全 。 


为 了 保持 完整 性 ， 我 给 出 了 两 个 没有 被 <math.h> 中 的 其 他 函数 使 用 的 
函数 。 但 其 他 标准 头 文件 中 声明 的 函数 用 到 了 它们 。 这 两 个 函数 需要 包含 
"xmath.h"。 看 起 来 把 这 两 个 函数 放 在 这 里 是 最 好 的 选择 。 

图 7-37 显示 了 文件 xatento.c， 这 个 文件 定义 了 函数 _Dtento。 该 函 
数 用 10 的 n RA RHEL double 类 型 的 值 x。 在 这 个 过 程 中 ， 它 避免 了 浮 点 
Lana VE ASK amul 中 对 _Dunscale 和 _Dscale 的 使 用 。 X 
i£ Dscale 中 发 生 了 任何 潜在 的 上 溢 或 者 下 浇 ， 它 都 会 安全 地 对 其 进行 处 
H. PR Dtento 假设 参数 x 是 零 或 者 有 限 大 。 
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函数 图 7-36 显示 文件 xldunsca.c， 它 定义 了 函数 _Ldunscale。 该 函数 
Låunscale 做 着 和 _punscale 相同 的 工作 ， 只 不 过 它 的 参数 是 long double 类 型 的 ， 而 
_Dunscale 的 参数 是 double 类 型 的 。 事 实 上 ， 如 果 这 两 种 浮 点 类 型 的 表示 相 
同 ， 那 么 它 的 工作 就 和 Dunscdle 的 完全 相同 了 。 只 有 当 DLONG 为 非 零 时 ， 

_Ldunscale 才 处 理 10 字 节 的 IEEE 754 扩展 精度 格式 。 


头 文件 图 7-38 显示 了 文件 xmath.h。 到 现在 为 止 ， 应 该 已 经 介绍 了 其 中 的 所 有 
"xmath.h" 奥秘 了 。 在 这 里 ， 为 了 保持 完整 性 ， 我 把 它 完整 地 显示 了 出 来 。 
7.5 «math.h» 的 测试 
测试 数学 函数 是 一 个 严肃 的 工作 ， 因 为 即使 是 那些 半数 值 函数 也 有 很 多 
出 错 的 可 能 ， 其 他 的 数学 函数 则 要 求 在 技术 上 多 花费 功夫 以 保证 其 正确 性 。 
这 就 是 我 使 用 elefunt 测试 来 验证 三 角 函 数 、 指 数 、 对 数 和 特殊 的 寡 函 数 的 
原因 。 
在 使 用 IEEE 754 浮 点 算术 的 Sun 3 工作 站 下 ， 这 些 测试 报告 的 最 坏 情况 
的 错误 是 一 个 小 于 两 位 的 精确 度 的 丢失 。 均 方 根 错误 一 般 情况 下 比 两 位 要 好 
得 多 。 


paranoia 测试 偶然 也 报告 一 个 小 于 两 位 的 错误 。( 这 里 容易 出 错 的 是 
sqrt 和 对 某 些 极 值 的 格式 化 输入 输出 函数 .) 4.6 中 讲述 了 如 何 才 能 获得 


paranoia 程序 。 


我 也 提供 了 测试 <math.h> 中 声明 的 所 有 函数 的 一 个 测试 集合 。 每 一 个 
函数 有 几 个 测试 实例 ， 足 以 验证 它 是 健全 的 。 然 而 ， 要 验证 <math.h> 中 声 
明 的 所 有 的 函数 ， 总 共 需 要 很 多 的 测试 。 所 以 ， 我 把 这 些 测试 分 到 了 3 个 文 
件 中 ， 每 一 个 文件 对 应 3 组 函数 中 的 每 一 双 


程序 图 7-39 显示 了 文件 tmath1.c。 它 测试 了 宏 HUGE VAL 和 所 有 的 半数 值 函 
tmathl.c 数 。 某 些 测试 可 以 产生 精确 的 结果 ， 其 他 的 可 能 会 产生 一 些小 错误 。 对 于 后 
Ki, BR approx 检测 出 结果 丢失 了 小 于 两 位 的 精度 。 这 个 程序 也 显示 

了 打印 函数 对 HUGE VAL 的 输出 。 


如 果 这 个 库 运 行 在 一 个 支持 Inf 和 NaN 两 种 特殊 编码 的 计算 机 体系 结构 
下 ， 这 个 程序 显示 如 下 输出 : 
SUCCESS testing «math.h», part 1 
程序 图 7-40 显示 了 文件 tmath2.c。 它 测试 了 所 有 的 三 角 函 数 在 角度 为 mw4 
tmath2.c 的 各 个 倍数 上 的 表现 。 这 些 通常 是 检测 精度 丢失 或 者 确定 结果 的 符号 错误 方 
面 的 关键 的 角度 值 。 如 果 所 有 的 测试 都 通过 了 ， 程 序 显示 如 下 信息 : 


SUCCESS testing <math .h>, part 2 
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图 7-36 /* .Ldunscale function -- IEEE 754 version */ 
xldunsca.c | #include "xmath.h" 


#if | DLONG /* 10-byte IEEE format */ 
#define LMASK Ox7fff 

#define  LMAX Ox7fff 

#define _LSIGN 0x8000 

*if  D0-- 


#define LO 4 /* little-endian order */ 
#define LI 3 

*define L2 2 

#define L3 1 

#define _L4 0 

#else 

#define LO 0 /* big-endian order */ 
#define L1 1 

#define _L2 2 

fdefine _L3 3 

#define L4 4 


fendif 


static short dnorm(unsigned short *ps) 
H /* normalize long double fraction */ 
short xchar; 


for (xchar = 0; ps[ Ll] == 0; xchar -= 16) 
{ /* shift left by 16 */ 
Del Li] = ps[ L2], ps[ L2] = ps[_L3]; 
ps[ L3] = ps[ L4], ps[ L4] = 0; 
) 
for (; ps[ L1] < 1U«« LOFF; --xchar) 
{ /* shift left by 1 */ 


ps[ Ll] = ps[ L1] << 1 | ps[ L2] >> 15; 
Dal L2] = ps[ L2] << 1 | pst. L3] >> 15; 
Del L3] = ps[ L3] << 1 | ps[ L4] >> 15; 
ps[ L4] ««- 1; 
) 

return (xchar); 


} 


short _Ldunscale(short *pex, long double *px) 
{ /* separate *px to |frac| < 1/2 and 2^*pex */ 
unsigned short *ps = (unsigned short *)px; 
short xchar = ps[ LO] & _LMASK; 


if (xchar == _LMAX) 
{ /* NaN or INF * / 
*pex = 0; 
return (ps[. L1] & Ox7fff || ps[ L2] 


|| ps[ 13] || ps[ L4] ? NAN : INF); 
NEN 
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图 7-36 else if (ps[ L1] == 0 && ps[ L2] == 0 
X) && ps[ L3] == 0 && ps[ L4] == 0) 

{ /* zero */ 
*pex = 0; 
return (0); 
} 

else 
{ /* finite, reduce to [1/2, 1) */ 


xchar += dnorm(ps); 
ps[ L0] = ps[ LO] & _LSIGN | _LBIAS; 
*pex = xchar - _LBIAS; 
return (FINITE); 
} 
} 


#else /* long double same as double */ 
short _Ldunscale(short *pex, long double *px) 
{ /* separate *px to |frac| < 1/2 and 2^*pex */ 
unsigned short *ps - (unsigned short *)px; 
short xchar = (ps[ DO] & _DMASK) >>  DOFF; 
if (xchar == | DMAX) 
{ /* NaN or INF */ 
*pex = 0; 
return (ps[ DO] & DFRAC || ps[ DI] 
|I! ps! D2] || psi, D3] ? NAN : INF); 
H 
else if (0 < xchar || (xchar = _Dnorm(ps)) != 0) 
{ /* finite, reduce to [1/2, 1) */ 
pel DO] = pel DO] & ~_DMASK | _DBIAS << _DOFF; 
*pex = xchar - _DBIAS; 


return (FINITE); 
H 

else 
{ /* zero */ 
*pex = 0; 
return (0); 
} 

} 

#endif e 


程序 图 7-41 显示 了 文件 tmath3.c。 它 测试 了 所 有 的 指数 、 对 数 和 特殊 的 曙 
tmath3.c 函数 的 一 些 明 显 的 属性 。 注 意 ， 其 中 的 一 两 个 测试 必须 生成 精确 的 结果 。 如 
果 所 有 的 测试 都 通过 了 ， 程 序 显 示 如 下 信息 : 
SUCCESS testing <math.h>, part 3 
我 很 刁 愧 地 说 ， 这 些 简单 的 测试 出 现 了 很 多 错误 。 有 一 些 错 误 在 我 第 一 次 编 
写 和 调试 数学 函数 的 时 候 就 产生 了 。 当 我 引入 各 种 “改进 ”的 时 候 ， 又 有 些 
更 加 令 人 难堪 的 错误 出 现 了 。 因 此 ， 我 学 会 了 在 任何 修改 之 后 认真 地 重新 运 
行 它们 。 
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图 7-37 
xdtento.c 


«math.h» 


/*  Dtento function -- IEEE 754 version */ 
include <errno.h> 
#include «float.h» 
#include "xmath.h" 


/* macros */ 
#define NPOWS (sizeof pows / sizeof pows[0] - 1) 
/* static data */ 


static const double pows [] = I 
lel, Lei, le4, le8, lel6, le32, 

#if Ox100 < DBIAS /* assume IEEE 754 8-byte */ 
le64, 1e128, 1e256, 

#endif 
3 


static const size t npows = {NPOWS}; 


Static short dmul(double *px, double y) 
( /* multiply y by *px with checking */ 
short xexp; 


_Dunscale(&xexp, px); 
*px *= y; 
return ( Dscale(px, xexp)); 


) 


double Dtento(double x, short n) 
{ /* compute x * 10**n */ 
double factor; 
short errx; 
size t i; 


if (n == 0 || x == 0.0) 
return (x); 

factor - 1.0; 

if (n « 0) 


{ /* scale down */ 
unsigned int nu = -(unsigned int)n; 
for (i = 0; 0 < nu && i < npows; nu >>= 1, ++i) 
if (nu & 1) 
factor *- pows[i]; 


errx - dmul(&x, 1.0 / factor); 
0 


if (errx « 0 && « nu) 

for (factor = 1.0 / pows[npows]; 0 < nu; --nu) 

if (0 <= (errx - dmul(&x, factor))) 
break; 
H 
else if (0 « n) 

( /* scale up */ 
for (i = 0; 0« n && i < npows; n >>= 1, ++i) 

if (n & 1) 


factor *- pows[i]; 


图 7-37 
GE) 


图 7-38 
xmath.h 
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errx - dmul(&x, factor); 
if (errx < 0 && 0 < n) 


for (factor - pows[npows]; 0 « n; --n) 
if (0 «- (errx - dmul(&x, factor))) 
break; 


) 
if (0 <= errx) 
errno = ERANGE; 
return (x); 


} ü 


/* xmath.h internal header -- IEEE 754 version */ 


#include <errno.h> 
#include «math.h» 
finclude «stddef.h» 
#ifndef _YVALS 
#include «yvals.h» 
#endif 

/* IEEE 754 properties */ 
#define  DFRAC ((1«« DOFF)-1) 
#define DMASK (Ox7fff&- DFRAC) 
#define DMAX ((1««(15-, DOFF))-1) 
#define _DNAN (0x8000| DMAX«« DOFF|1««( DOFF-1)) 
#define  DSIGN 0x8000 
#define DSIGN(x) (((unsigned short *)&(x))[ DO] &  DSIGN) 
#define HUGE EXP (int) ( DMAX * 900L / 1000) 
#define HUGE RAD 3.14e30 
ddefine SAFE EXP ( DMAX>>1) 

/* word offsets within double */ 

Sif _DO== 
#define _D1 2 /* little-endian order */ 
#define _D2 
#define D3 0 
#else ] 
#define Dl 1 /* big-endian order */ 
#define _D2 
#define _D3 3 
fendi f 

/* return values for D functions */ 
#define FINITE -1 
#define INF 1 
#define NAN 2 

/* declarations */ 
double _Atan(double, unsigned short); 
short Dint(double *, short); 
short _Dnorm (unsigned short zi: 
short _Dscale (double *, short); 
double Dtento(double, short); 
short _Dtest (double zi: 
short  Dunscale(short *, double *); 
short _Exp(double *, short); 
short  Ldunscale(short *, long double *); 
double  Poly(double, const double *, int); 
extern Dconst Inf, Nan, _Rteps, Xbig; 


KA 
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图 7-39 
tmathl.c 


[7> test math functions -- part 1 */ 
finclude «assert.h» 

#include «float.h» 

include «math.h» 

#include <stdio.h> 


static double eps; 


static int approx(double dl, double d2) 


t /* test for approximate equality */ 
if (d2 != 0) 
return (fabs((d2 - dl) / 32) « eps); 
eise 
return (fabs(dl) « eps); 
) 
int main () 
{ /* test basic workings of math functions */ 


double huge_val, x; 
int xexp; 


huge_val = HUGE_VAL; 
eps = DBL_EPSILON * 4.0; 


assert (ceil (-5.1) == -5.0); 
assert (ceil (-5.0) == -5.0); 
assert (ceil(-4.9) == -4.0); 
assert (ceil(0.0) == 0.0); 
assert (ceil (4.9) == 5.0); 
assert (ceil(5.0) == 5.0); 
assert (ceil(5.1) == 6.0); 
assert (fabs (-5.0) == 5.0); 
assert (fabs (0.0) == 0.0) 
assert (fabs(5.0) == 5.0); 
assert (floor (-5.1) == -6.0); 
assert (floor (-5.0) == -5.0); 
assert (floor (-4.9) == -5.0); 
assert (floor (0.0) == 0.0); 
assert(floor(4.9) == 4.0); 
assert(floor(5.0) == 5.0); 
assert( floor(5.1) == 5.0); 
assert(fmod(-7.0, 3.0) -- -1.0); 
assert(fmod(-3.0, 3.0) -- 0.0); 
assert(fmod(-2.0, 3.0) 

) 


assert(fmod(0.0, 3.0 0 
assert(fmod(2.0, 3.0) == 2.0); 
assert(fmod(3.0, 3.0) -- 0 

1 


assert(fmod(7.0, 3.0) == 1.0); 

assert (approx(frexp(-3.0, &xexp), -0.75) && xexp == 2); 
assert (approx(frexp(-0.5, &xexp), -0.5) && xexp == 0); 
assert(frexp(0.0, &xexp) == 0.0 && xexp == 0); 
assert(approx(frexp(0.33, &xexp), 0.66) && xe == -1) ; 
assert (approx (frexp(0.66, &xexp), 0.66) && xexp == 0); 
assert (approx(frexp(96.0, &xexp), 0.75) && xexp == 7); 
assert(ldexp(-3.0, 4) == -48.0); 


| assert (idexp(-0.5, 0) == -0.5); 


图 7-39 
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assert(ldexp(0.0, 36) == 0.0); 
assert(approx(ldexp(0.66, -1), 0.33)); 
assert(ldexp(96, -3) == 12.0); 
assert(approx(modf(-11.7, &x), -11.7 + 11.0) 
&& x -- -11.0); 
assert(modf(-0.5, &x) == -0.5 && x == 0.0); 
assert(modf(0.0, &x) -- 0.0 && x -- 0.0); 
assert(modf(0.6, &x) == 0.6&& x == 0.0); 
assert(modf(12.0, &x) -- 0.0&& x -- 12.0); 


printf("HUGE VAL prints as %.16e\n", huge val); 
puts("SUCCESS testing «math.h», part 1"); 
return(0); 


) 口 
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William J. Cody, Jrand William Waite, Software Manual For the Elementary 
Functions (Englewood Cliffs, N.J.: Prentice-Hall, Inc., 1980). 在 编写 稳定 的 和 高 
精度 的 数学 函数 方面 ， 这 是 一 本 非常 好 的 参考 手册 。 它 是 本 章 中 很 多 函数 的 
近似 值 的 来 源 。 

John F. Hart. E.W. Cheney, Charles L. Lawson, Hans J. Maehly, 
Charles K. Mesztenyi. John R. Rice, Henry G. Thacher. Jr. 和 Christoph 
Witzgall,Computer Approximations (Malabar, Florida: Robert E. Krieger Publish- 
ing Company, 1978). 这 本 书 中 有 几 章 是 关于 数值 通 近 的 艺术 和 科学 的 ， 但 是 
它 大 部 分 讲 的 都 是 它 的 广泛 的 系数 表 。 对 所 有 常用 的 数学 函数 ， 你 都 可 能 会 
找到 一 个 你 需要 的 精度 的 近似 值 。 


elefunt 是 一 个 可 移植 的 FORTRAN 程序 集 ， 这 些 程序 在 提供 
FORTRAN 编译 器 的 情况 下 ， 可 以 测试 基本 函数 程序 。 它 们 非常 完整 。 这 些 
程序 是 william J.Cody 用 FORTRAN 编写 的 ， 在 Cody 和 Waite 的 书 中 有 详细 
的 讲解 。 你 可 以 用 以 下 请 求 来 向 netlib@research.att.com 发 邮件 : 


send index from elefunt 


确定 你 的 C 翻译 器 的 浮 点 数 表 示 。 可 以 修改 <yvals.h> 中 的 参数 来 适应 你 的 
翻译 器 吗 ? 如 果 可 以 ， 就 实现 它 ， 否 则 ， 修 改 原 语 来 适应 它 。 


编写 函数 double hypot (double，double)， 这 个 函数 计算 它 的 参数 的 平方 
和 的 平方 根 〈 如 果 把 直角 三 角形 的 两 个 直角 边 作为 参数 ， 函 数 的 计算 结果 就 
是 它 的 斜 边 )。 用 下 面 的 表达 式 来 测试 它 : 

hypot (0.7 * DBL MAX, 0.7 * DBL MAX); 

hypot (DBL MAX, 1.0); 

hypot (1.0, DBL MAX); 

hypot (3.0, 4.0); 
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图 7-40. /* test math functions -- part 2 */ 
tmath2.c #include «assert.h» 
finclude «float.h» 
finclude <math.h> 
#include <stdio.h> 


/* static data */ 
static double eps; 


static int approx(double di, double d2) 


{ /* test for approximate equality */ 
return ((d2 ? fabs((d2 - dl) / d2) : fabs(dl)) < eps); 
) 
int main() 
H /* test basic workings of math functions */ 
double x; 
int xexp; 


static double piby4 = {0.78539816339744830962); 
static double rthalf = (0.70710678118654752440) ; 


eps = DBL EPSILON * 4.0; 

assert (approx (acos(-1.0), 4.0 * piby4)); 
assert (approx (acos(-rthalf), 3.0 * piby4)); 
assert (approx(acos(0.0), 2.0 * piby4)); 
assert(approx(acos(rthalf), piby4)); 

assert (approx(acos(1.0), 0.0)); 
assert(approx(asin(-1.0), -2.0 * piby4)); 
assert(approx(asin(-rthalf), -piby4)); 
assert (approx (asin(0.0), 0.0)); 

assert (approx (asin(rthalf), piby4)); 

assert (approx(asin(1.0), 2.0 * piby4)); 
assert(approx(atan(-DBL MAX), -2.0 * piby4)); 
assert(approx(atan(-1.0), -piby4)); 

assert (approx (atan(0.0), 0.0)); 

assert (approx {atan(1.0), piby4)); 

assert (approx (atan(DBL MAX), 2.0 * piby4)); 


assert(approx(atan2(-1.0, -1.0), -3.0 * piby4)); 
assert(approx(atan2(-1.0, 0.0), -2.0 * piby4)); 
assert (approx(atan2(-1.0, 1.0), -piby4)); 


assert (approx(atan2(0.0, 1.0), 0.0)); 

assert (approx(atan2(1.0, 1.0), piby4)); 

assert(approx(atan2(1.0, 0.0), 2.0 * piby4)); 

assert(approx(atan2(1.0, -1.0), 3.0 * piby4)); 

assert(approx(atan2(0.0, -1.0), 4.0 * piby4) 
|| approx(atan2(0.0, -1.0), -4.0 * piby4)); 

assert (approx(cos(-3.0 * piby4), -rthalf)); 

assert (approx (cos(-2.0 * piby4), 0.0)); 

assert (approx(cos(-piby4), rthalf)); 

assert (approx(cos(0.0), 1.0)); 

assert (approx (cos (piby4), rthalf)); 

assert (approx(cos(2.0 * piby4), 0.0)); 


assert (approx(cos(3.0 * piby4), -rthalf)); 
assert (approx(cos(4.0 * piby4), -1.0)); 
assert (approx(sin(-3.0 * piby4), -rthalf)); 
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图 7-40 
( 续 ) 


7.3 


7.4 


7.5 


7.6 


7.7 


7.8 


assert (approx(sin(-2.0 * piby4). -1.0)); 
assert (approx(sin(-piby4). -rthalf)); 
assert(approx(sin(0.0). 0.0)); 

assert (approx(sin(piby4). rthalf)); 
assert (approx(sin(2.0 *piby4), 1.0)); 
assert (approx(sin(3.0 *piby4), rthalf)); 
assert (approx(sin(4.0 *piby4). 0.0)); 
assert (approx (tan(-3.0 *piby4). 1.0)); 
assert (approx(tan(-piby4), -1.0)); 

assert (approx(tan(0.0). 0.0)); 

assert (approx (tan(piby4). 1.0)); 

assert (approx (tan(3.0 * piby4), -1.0)); 
puts("SUCCESS testing <math.h>, part 2"); 
return (0); 


} 


编写 执行 复数 算术 的 函数 。 每 一 个 复数 值 xtixy 可 以 用 一 有 序 对 (x, y) KE 
示 。 至 少 要 提供 比较 、 减 法 、 加 法 、 除 法 、 乘 法 、 求 模 和 定 相 几 种 功能 。 也 
要 提供 可 以 在 现 有 的 浮 点 类 型 和 复数 类 型 之 疗 进行 转换 的 函数 。 你 可 以 利用 
任何 现 有 的 函数 吗 ? 还 需要 其 他 的 什么 函数 ? 

修改 <math.h> 中 的 原 语 ， 来 消除 NaN, Inf 和 -Inf 这 些 特殊 编码 。 在 任何 可 
能 的 地 方 用 "xmath.h" 中 的 宏 来 代替 原 语 。 这 些 对 C 标准 库 中 的 函数 的 大 小 
有 什么 影响 ”对 执行 时 间 呢 ? 


DE] 编写 所 有 的 可 以 接受 float 类 型 的 参数 和 产生 float 类 型 的 结果 的 数学 函 
数 版 本 。 在 每 一 个 现 有 的 函数 名 后 面 加 上 £ 作为 新 的 函数 名 。 怎 样 测试 这 些 
函数 ? 

[ 难 ] 编写 所 有 的 可 以 接受 long double 类 型 参数 并 产生 long double 类 型 结果 
的 数学 函数 的 版 本 。 在 每 一 个 现 有 的 函数 名 后 面 加 上 1 作为 新 的 函数 名 。 怎 
样 测试 这 些 函 数 ? 

[ 难 ] 编写 所 有 的 可 以 接受 复数 参数 并 产生 复数 结果 的 数学 函数 的 版 本 。 在 每 
一 个 现 有 的 函数 名 前 面 加 上 c 作为 新 的 函数 名 。 怎 样 测试 这 些 函 数 ? 


[很 难 ] 通过 比较 一 个 很 大 的 代码 集 ， 确 定 是 否 有 些 数学 函数 值得 编写 为 内 联 
代码 。 修 改 一 个 C 编译 器 来 实现 它 ， 对 结果 进行 测量 。 
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图 7-41 /* test math functions -~ part 3 */ 
tmath3.c finclude <assert.h> 


#include <float.h> 
#include <math.h> 
#include <stdio.h> 


Static double eps; 


Static int approx(double dl, double d2) 


int 


{ /* test for approximate equality */ 
return ((d2 ? fabs((d2 - dl) / d2) : fabs(dl)) < eps); 

} 

main() 

{ /* test basic workings of math functions */ 
double x; 


int xexp; 

static double e = {2.71828182845904523536) ; 
static double 1n2 = (0.69314718055994530942) ; 
static double rthalf = (0.70710678118654752440) ; 


eps = DBL EPSILON * 4.0; 


assert(approx(cosh(-1.0), (e + 1.0/ e) / 2.00); 
assert(approx(cosh(0.0), 1.0)); 
assert(approx(cosh(1.0), (e + 1.0 / e} / 2.0)); 


assert (approx(exp(-1.0), 1.0 / e)); 
assert (approx(exp(0.0), 1.0)); 
assert(approx(exp(1n2), 2.0)); 
assert(approx(exp(1.0), e)); 


assert(approx(exp(3.0), e * e * e)); 
assert(log(1.0) == 0.0); 

assert (approx (log(e), 1.0)); 

assert (approx(log(e * e * e), 3.0)); 


assert(approx(logl10(1.0), 0.0)); 
assert(approx(log10(5.0), 1.0 - 10g10(2.0))); 
assert (approx(logl0(le5), 5.0)); 

assert (approx (pow(-2.5, 2.0), 6.25)); 

assert (approx (pow(-2.0, -3.0), -0.125)); 
assert (pow(0.0, 6.0) == 0.0); 

assert (approx (pow(2.0, -0.5), rthalf)); 
assert (approx (pow(3.0, 4.0), 81.0)); 


assert (approx(sinh(-1.0), -(e - 1.0 / e) / 2.0)); 
assert (approx(sinh(0.0), 0.0)); 
assert (approx(sinh(1.0), (e - 1.0 / e) / 2.0)); 


assert (approx(sqrt(0.0), 0.0)); 

assert (approx (sqrt(0.5), rthalf)); 
assert (approx(sqrt(1.0), 1.0)); 

assert (approx(sqrt(2.0), 1.0 / rthalf)); 
assert (approx (sgqrt(144.0). 12.0)); 


assert (approx(tanh(-1.0), -(e * e- 1.0) / (ex e + 1.0))); 
assert (approx (tanh(0.0), 0.0)); 
assert (approx(tanh(1.0), (e * e - 1.0) / (e * e + 1.0) )); 


puts("SUCCESS testing <math.h>, part 3"); 
return (0); 


} 口 
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非 本 地 的 goto 


C 程序 设计 语言 不 允许 函数 的 艇 套 定义 ， 也 就 是 说 我 们 不 能 在 一 个 函数 
内 部 定义 另 一 个 函数 ， 就 像 下 面 的 定义 方式 : 


int f(void) 
{ /* outer function */ 
int g(void) 
{ /* NOT PERMITTED */ 


这 种 限制 让 我 们 不 能 隐藏 同一 层 上 的 函数 名 ， 所 以 在 一 个 翻译 单元 内 声 
明 的 所 有 函数 彼此 之 间 都 是 可 见 的 。 这 并 不 是 主要 的 缺陷 ， 因 为 我 们 可 以 把 
属于 不 同 翻译 单元 的 函数 进行 分 组 并 放置 在 不 同 的 C 源 文 件 中 ， 这 样 就 可 以 
限制 它们 之 间 的 可 见 性 了 。 


然而 ， 因 为 这 种 设计 ，C 语言 在 男 一 个 方面 遇 到 了 麻烦 。 除 了 返回 调用 
那个 函数 的 表达 式 外 ，C 语言 没有 提供 其 他 将 控制 权 转 移 到 一 个 函数 之 外 的 
比较 简单 的 方法 。 对 于 大 多 数 的 函数 调用 来 说 ， 这 样 的 限制 很 方便 ， 办 为 我 
们 需要 用 骨 套 函数 调用 和 返回 的 规则 来 帮助 理解 程序 的 控制 流 。 不 过 ， 在 某 
些 情况 下 ， 这 个 规则 的 限制 性 太 强 了 。 有 时 ， 如 果 能 一 下 子 跳 出 一 个 或 多 个 
函数 调用 ， 程 序 会 更 易 编 写 和 理解 。 我 们 希望 跳 过 一 个 正常 的 函数 返回 ， 把 
控制 权 交 给 更 早 的 函数 调用 的 某 个 地 方 。 这 通常 是 处 理 严重 的 错误 的 最 好 方 
式 。 


在 Pascal 中 就 可 以 这 样 做 。 一 个 嵌 套 的 函数 中 可 以 包含 一 个 goto WA), 
该 语句 可 以 把 控制 权 转 移 给 一 个 函数 之 外 的 标号 。(C 中 的 void 类 型 的 函数 
在 Pascal 中 叫做 过 程 ， 在 这 里 也 使 用 “函数 ”来 表示 Pascal 中 的 过 程 .) 这 
个 标号 可 以 在 任何 包含 府 套 函数 定义 的 函数 中 ， 如 下 所 示 : 


function x: integer; {a Pascal goto example) 
label 99; 
function y(val: integer): integer; 
begin 
if val « 0 then 
goto 99; 
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jmp buf 
longjmp 
setjmp 


在 一 个 Pascal PRA, FRE TE HE AG BH o es, 
然后 翻译 器 才能 识别 出 一 个 非 本 地 的 goto. 


H — ARRAK goto 通常 可 以 很 容易 地 把 控制 权 转移 给 具有 相应 标号 的 
诸 句 ， 而 对 于 一 个 非 本 地 的 goro 就 有 些 麻 烦 了 。 它 必须 先 终止 当前 活动 的 函 
数 调 用 的 执行 ， 而 这 样 做 又 涉及 了 释放 所 有 的 动态 分 配 的 空间 和 恢复 前 面 的 
调用 环境 ，Pascal 甚至 要 关闭 与 通过 这 种 方式 释放 的 所 有 file 变量 相关 的 
文件 。 调 用 了 包含 该 goro 语句 的 责 数 的 函数 再 次 成 为 活动 的 函数 。 如 果 goto 
语句 中 命名 的 标号 不 在 当前 活动 的 函数 中 ， 这 个 过 程 就 会 重复 。 最 终 ， 正 确 
的 两 数 会 再 一 次 活动 起 来 ， 并 把 控制 权 转 移 到 具有 相应 标号 的 语句 。 调 用 包 
Å goto 诸 句 的 函数 的 表达 式 永远 都 不 会 完成 它 的 执行 。 


Pascal 使 用 函数 舱 套 的 某 些 规则 来 限制 非 本 地 goto Hi]. Pascal 语言 不 
允许 把 控制 权 转 移 给 不 活动 的 函数 ， 所 以 我 们 不 能 把 控制 权 转 移 给 一 个 未 知 
的 函数 。 后 来 证 明 这 是 Pascal 语言 比 C 语言 做 得 好 的 一 个 方面 。 


更 老 的 PL/ 语言 使 用 了 另外 一 种 方法 来 解决 这 个 问题 ， 即 允许 声明 标号 
变量 。 我 们 可 以 在 一 个 上 下 文 环境 中 将 一 个 标号 赋 给 这 样 一 个 变量 ， 然 后 在 
另 一 个 上 下 文 环 境 中 把 该 变量 作为 goto 语句 的 目标 使 用 。 标 号 变量 中 存储 了 
程序 执行 非 本 地 goto 请 句 需要 的 所 有 信息 。(goto 不 一 定 是 非 本 地 的 ， 也 可 
以 把 控制 权 转 移 给 当前 函数 的 当前 调用 中 的 标号 。) 


与 Pascal 语言 所 用 的 方法 相 比 ，PL/I 语言 所 使 用 的 方法 结构 化 方面 很 
差 。 因 为 PL/L 中 所 定义 的 标号 变量 可 能 没有 初始 化 就 在 goto 语句 中 使 用 了 ， 
或 者 赋 给 变量 的 标号 可 能 指向 一 个 已 经 终止 的 函数 调用 ， 不 能 用 了 。 不 论 是 
哪 种 情况 ， 造 成 的 损失 都 很 惨重 。 除 非 该 实现 可 以 在 转移 控制 权 之 前 确认 标 
号 变量 的 内 容 ， 否 则 ， 这 种 跳 转 就 可 能 出 错 ， 而 且 这 样 的 错误 很 难 调试 。 


C 语言 使 用 库 函数 来 实现 非 本 地 控制 转移 。 头 文件 <setjmp.h> 提供 了 
以 下 必需 的 机 制 。 


O 类 型 jmp_buf， 你 可 以 把 它 当 成 标号 数据 对 象 类 型 看 待 。 

C) 函数 longjmp， 用 来 实现 非 本 地 控制 转移 。 

O X setjmp， 把 当前 调用 的 上 下 文 信息 存储 到 一 个 jmp_buf 类 型 的 数 
据 对 象 中 ， 并 在 你 想 把 控制 权 传递 给 相应 的 longjmp 调用 的 地 方 作 
标记 。 

在 这 点 上 ，C 语言 的 机 制 甚至 比 PLI 语言 的 非 结 构 化 goto 还 要 原始 。 我 们 所 
能 做 的 工作 就 是 记录 下 程序 前 期 执行 的 某 个 位 置 ， 然 后 通过 合适 的 jmp_buf 
数据 对 象 为 参数 调用 Longjme 来 返回 到 那个 位 置 。 但 是 如 果 这 个 数据 对 象 没 
有 初始 化 或 者 已 经 过 期 ， 那 么 就 可 能 引发 一 场 灾 难 。 
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两 个 危险 之 处 


执行 setjmp 


存储 空间 的 
回收 


longjmp 和 setjmp 都 是 很 微妙 的 函数 。 它 们 强制 干涉 控制 流 和 动态 存 
储 空间 的 管理 。 这 两 方面 都 是 翻译 器 中 非常 复杂 和 难以 编写 的 部 分 。 这 部 分 
必须 生成 既 正 确 又 优化 空间 和 运行 速度 的 代码 。 优 化 经 常 涉及 控制 流 的 细微 
改变 或 者 动态 空间 的 使 用 。 但 是 代码 生成 器 又 经 常 是 在 忽略 了 10ngjmp Fil 
setjmp 的 属性 和 行为 的 情况 下 工作 的 。 


C 标准 指出 了 两 个 存在 潜在 危险 的 地 方 : 

D WRK setjmp 的 表达 式 。 

口 在 执行 setjmp 的 函数 中 声明 的 动态 存储 空间 。 
在 这 两 种 情况 下 ，C 标准 中 的 措辞 有 点 让 人 不 解 ， 这 是 因为 C 标准 试图 限制 
危险 的 行为 有 强调 这 些 危险 。 


其 中 一 个 危险 之 处 在 于 表达 式 计 算 。 一 般 电 脑 都 有 一 定数 量 的 寄存 器 ， 
在 对 表达 式 进行 求 值 的 时 候 ， 寄 存 器 用 来 保存 中 间 结 果 。 然 而 ， 在 计算 一 个 
非常 复杂 的 表达 式 时 ， 这 些 寄存 器 可 能 不 够 用 。 这 时 用 户 就 会 迫使 代码 生成 
需 把 中 间 结 果 存 储 在 动态 存储 空间 中 。 

这 样 问题 就 来 了 。setjmp 必须 要 猜测 多 少 “ 调 用 上 下 文 ” 存 储 到 
jmp_buf 数据 对 象 中 。 某 些 寄 存 器 的 值 需要 保存 起 来 。 可 以 在 函数 调用 过 程 
中 保存 中 间 结 果 的 寄存 器 是 首选 ， 因 为 longjmp 调用 可 能 出 现在 被 调用 的 函 
数 中 。 一 旦 程序 要 计算 setjmp 的 值 ， 它 就 需要 这 些 中 间 结 果 来 完成 表达 式 
RA. WER setjmp 不 能 保存 所 有 的 中 间 结 果 ，1longjmp 调用 的 后 续 返 回 就 
会 出 现 问题 。 

C 标准 规定 把 包含 setjmp 的 表达 式 作为 子 表达 式 使 用 。 这 种 做 法 是 为 
了 排除 某 些 可 能 把 中 间 结 果 存 储 在 setjmp RA (并 且 不 可 知 ) 的 动态 存储 


空间 中 的 表达 式 。 因 而 你 可 以 编写 类 似 switch (setjmp (buf))..., if 
(2«setjmp (buf) )...,if (!setjmp (buf) )... 的 形式 和 表达 式 语 句 


setjmp (buf), 


你 不 可 能 写 出 比 这 些 更 复杂 的 形式 了 。 注 意 ， 我 们 不 能 可 靠 地 把 setjmp 
的 值 赋 给 其 他 的 变量 ， 就 像 n = setjmp (buf) 这 样 。 这 种 表达 式 可 能 会 正 
确 地 求 值 ， 但 C 标准 并 没有 作 这 样 的 要 求 。 

第 二 个 危险 的 地 方 是 关于 处 理 执行 setjmp 的 函数 中 的 动态 存储 空间 的 
问题 。 这 样 的 存储 空间 出 现在 以 下 3 种 情况 中 。 

口 为 函数 声明 的 参数 。 

O 所 有 使 用 auto 存储 类 型 说 明 符 声明 的 数据 对 象 ， 不 管 是 显 式 的 还 是 

hasty. 
D 所 有 用 register 存储 类 型 说 明 符 声明 的 数据 对 象 。 


184 第 83. «setjmp.h» 


易 变 的 动态 
存储 空间 


这 些 问 题 出 现 的 原因 是 代码 生成 器 可 以 选择 把 一 些 数 据 对 象 存储 在 寄存 器 中 。 
这 些 寄存 器 组 和 存储 表达 式 求 值 过 程 中 的 临时 中 间 值 的 寄存 器 是 无 法 区 分 的 。 因 
此 ， 在 一 个 longjmp 调用 中 ，setjmp 必须 保存 所 有 这 些 寄存 器 并 且 把 它们 恢复 
到 一 个 早期 的 状态 。 这 就 意味 着 在 setjmp 的 后 续 返 回 中 ， 某 些 动态 数据 对 象 返 
回 到 了 一 个 更 早 的 状态 。setJjme 的 两 次 返回 之 间 的 存储 值 的 任何 变化 都 会 天 失 。 

如 果 这 样 的 行为 是 可 预见 的 ， 那 么 它 就 是 一 种 讨厌 的 异常 情况 。 但 问 
题 是 它 是 不 可 预见 的 。 用 户 无 法 知道 哪些 参数 和 auto 数据 对 象 最 后 保存 在 
寄存 器 中 。 甚 至 声明 为 register 的 数据 对 象 也 是 不 确定 的 。 翻 译 器 没有 
责任 把 任何 这 样 的 数据 对 象 存储 在 寄存 器 中 。 因 此 ， 如 果 一 个 函数 执行 了 
setjmp， 并 且 一 个 longjmp 调用 把 控制 权 转 交 回 了 函数 ， 那 么 函数 中 声明 的 
所 有 数据 对 象 的 值 都 是 不 确定 的 。 这 种 事件 处 于 一 种 无 规律 的 状态 。 

X3J11 通过 向 语言 中 添加 一 个 小 功能 来 处 理 这 个 问题 。 我 们 可 以 把 一 个 
动态 数据 对 象 声 明 为 volatile 类 型 ， 然 后 翻译 器 就 会 更 加 小 心地 对 待 它们 。 这 
种 类 型 的 数据 对 象 永远 都 不 会 存储 到 longjmp 可 以 修改 到 的 地 方 。 当 然 ， 这 
种 用 法 扩展 了 volatile 的 语义 ， 但 这 确实 有 效 。 


82 C 标准 的 内 容 


«setjmp.h» | 7.6 非 本 地 跳 转 <setjmp.b> 


jmp buf 


setjmp 


头 文件 «setimp.h» 定义 了 宏 setjmp， 并 且 为 了 绕 过 正常 的 函数 调用 和 返回 规则 声明 
了 一 个 函数 和 一 个 类 型 '”。 

声明 的 类 型 是 : 

jmp buf 

它 是 一 个 数组 类 型 ， 适 合 存储 恢复 一 个 调用 环境 所 需 的 信息 。 

并 没有 指定 setjmp 是 一 个 宏 还 是 一 个 用 外 部 连接 声明 的 标识 符 。 如 果 为 了 访问 - -个 
实际 的 函数 而 取消 了 宏 定义 ， 或 者 程序 使 用 名 字 setjmp 定义 一 个 外 部 标识 符 ， 则 行为 未 定义 。 
7.6.1 保存 调用 环境 
7.6.1.1 £ setjmp 

概述 


#include <setjmp.h> 
int setjmp (jmp buf env); 


说 明 

E setjmp 将 它 的 调用 环境 保存 在 它 的 jmp buf 类 型 的 参数 中 ， 以 供 后 面 longjmp Å 
数 使 用 。 

返回 值 

如 果 返 回来 自 一 个 直接 的 调用 ， 则 宏 setjmp 返回 零 。 如 果 返 回来 白 对 函数 longjmp 
的 调用 ， 则 宏 setjmp 返回 一 个 非 零 值 。 

环境 限制 

宏 setjmp 的 调用 应 该 只 出 现在 下 面 某 个 上 下 文 环 境 中 。 

e 一 个 选择 或 者 循环 语句 的 整个 控制 表达 式 ; 
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。 关系 运算 符 或 者 等 于 运算 符 的 其 中 一 个 操作 数 ， 另 一 个 操作 数 是 一 个 整 值 常 量 表 
达 式 ， 它 的 结果 表达 式 是 一 个 选择 或 者 循环 语句 的 整个 控制 表达 式 。 
。 一 元 操作 符 | 的 操作 数 ， 它 的 结果 表达 式 是 一 个 选择 或 者 循环 语句 的 整个 控制 表 
。 是 一 个 表达 式 语 名 《可 能 强制 转换 为 void 类 型 ) 的 整个 表达 式 。 
7.6.2 恢复 调用 环境 
概述 
#include «setjmp.h» 
void longjmp(jmp buf env, int val); 

说 明 

函数 Longjmp 使 用 相应 的 jmp buf 参数 来 恢复 程序 的 相同 调用 中 宏 setjmp 的 最 近 
一 次 调用 保存 的 环境 。 如 果 没 有 这 样 的 调用 ， 或 者 包含 宏 setjmp 调用 的 函数 已 经 在 其 前 
终止 执行 "“， 则 行为 未 定义 。 

所 有 可 访问 的 对 象 从 Longjmp 被 调用 的 时 候 起 就 有 确定 值 ， 但 包含 相应 的 宏 
setjmp 调用 的 两 数 中 的 、 没 有 volatile 类 型 的 和 在 setjmp 与 longjmp 调用 之 间 改 
动 了 的 具有 自动 存储 期 的 对 象 的 值 是 不 确定 的 。 

因为 它 能 绕 过 常规 的 函数 调用 和 返回 机 制 ， 所 以 函数 longjmp 可 以 在 中 断 、 信 号 和 
其 他 相关 的 函数 的 上 下 文 环 境 中 正确 地 执行 。 然 而 ， 如 果 在 一 个 髓 套 的 信号 处 理 程序 〈 就 
是 说 ， 在 一 个 信号 处 理 的 过 程 中 又 发 生 了 另 一 个 信号 ， 这 时 调用 的 那个 琐 数 ) 内 部 调用 
longjmp 函数 ， 则 行为 未 定义 。 

返回 值 

在 1ongjmp 完成 之 后 ， 程 序 会 继续 执行 ， 就 好 像 相应 的 宏 setjmp 的 调用 返回 了 val 
TEM. PAA 1ongjmp 不 能 让 宏 setjmp 返回 零 ， 如 果 val F, MÆ setjmp 返回 1。 


脚注 

106. 这 些 函 数 对 处 理 程 序 中 的 低级 函数 中 遇 到 的 异常 情况 很 有 用 。 

107. 例如 ， 通 过 执行 return 语句 ， 或 者 因为 另 一 个 longimp 调用 使 得 执行 转移 到 
这 一 组 嵌 套 调用 中 的 更 前 的 一 个 函数 中 的 setjmp 调用 。 


8.3 <setjmp.h> 的 使 用 
不 论 什么 时 候 ， 只 要 想 绕 过 常规 的 函数 调用 和 返回 规则 ， 就 可 以 使 用 
«setjmp.h», <setjmp.h> 提供 的 非 本 地 跳 转 是 一 个 很 脆弱 的 机 制 ， 只 有 
在 非 用 不 可 的 时 候 才 使 用 它 而 且 只 能 采用 特殊 的 方式 使 用 。 我 建议 你 使 用 以 
下 这 种 标准 方式 : 
O 把 每 个 对 setjmp 的 调用 分 离 到 一 个 独立 的 《〈 小 ) 函数 中 。 那 样 ， 就 
会 使 出 现 动态 声明 的 数据 对 象 被 longjmp 调用 恢复 的 情况 减 到 最 少 。 
O 在 一 个 switch 语句 的 控制 表达 式 中 调用 setjmp. 
O 在 switch 语句 的 case 0 中 调用 的 函数 (PRE process) 中 执行 所 有 
实际 的 过 程 。 
O 通过 执行 1ongjmp (1) 调用 ， 在 任意 位 置 报告 错误 并 且 重 新 启动 process。 
O 通过 执行 1ongjmp (2) 调用 ， 在 任意 位 置 报告 错误 并 终止 process. 
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也 可 以 添加 其 他 的 case 标号 来 处 理 longjmp 所 允许 的 其 他 的 参数 值 。 
一 个 最 高 级 别 的 函数 可 能 具有 以 下 形式 : 


#include «setjmp.h» 
static jmq buf jmpbuf; 


void top level(void) 
{ /* the top-level function */ 
for (; ; ) 
switch (setjmp(jmpbuf)) 
{ /* switch on alternate returns */ 
case 0: /* first time */ 
process(); 
return; 
case 1: /* restart */ 
<report error> 
break; 
case 2: /* terminate */ 
<report error> 
return; 
default:/* unknown longjmp argument */ 
<report error> 
return; 
} 
} 
这 里 我 假设 所 有 对 jmpbut 的 引用 都 在 这 个 翻译 单元 内 。 和 否则 ， 必 须 用 
一 个 外 部 连接 来 声明 jmppbuf.。(〈 丢 掉 存储 分 类 关键 字 static.) 或 者 ， 必 


须 向 那些 一 定 要 访问 jmpbuf 的 函数 提供 一 个 指向 它 的 指针 。 


注意 ，jmp_buf 是 一 个 数组 类 型 。 如 果 写 了 参数 jmpbuf， 翻 译 器 会 把 
它 改 为 指向 数组 的 第 一 个 元 素 的 指针 ， 因 为 那 才 是 setjmp fll longjmp 所 
需要 的 。 所 以 即使 jmpbuf 看 起 来 传递 的 是 值 ， 实 际 上 它 是 通过 引用 传递 
的 。 这 就 是 setjmp 在 jmpbut 中 存储 调用 环境 的 方式 。 


为 了 保持 一 致 ， 应 该 把 每 一 个 形 参 都 声明 为 jmp_buf buf， 然 后 再 定 
义 相 应 的 实 参 为 jmpbuf。 不 要 把 形 参 声明 为 jmp_buf *pbuf 或 者 把 实 参 写 
为 &jmpbuf。 后 者 更 清晰 ， 但 是 它 与 调用 setjmp 和 Longjmp 的 传统 习惯 
不 一 致 。 


如 果 选 择 setjmp 的 另 一 种 使 用 方法 ， 那 么 在 一 个 尽 可 能 小 的 函数 中 执 
行 这 个 宏 。 如 果 翻 译 器 不 对 setjmp 进行 特殊 的 处 理 ， 程 序 就 有 可 能 通过 。 
但 如 果 它 发 觉 setjmp 有 问题 ， 那 么 为 了 安全 ， 这 个 宏 的 几乎 所 有 代码 都 要 
进行 优化 。 

如 果 在 一 个 信号 处 理 器 的 内 部 调用 1ongjmp， 就 会 出 现 另 外 一 个 警告 。 
第 9 章 详 细 地 讨论 了 这 些 问题 。 
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8.4 <setjmp.h> 的 实现 


图 8-1 
setjmp.h 


实现 setjmp 和 1ongjmpb 的 唯一 可 靠 的 方式 就 是 用 汇编 语言 来 编写 这 些 
函数 。 你 需要 清楚 地 知道 翻译 器 是 怎样 生成 代码 的 ， 也 需要 执行 一 些 不 能 用 
C 语言 安全 表达 的 操作 。 


图 8-1 显示 了 文件 setjmp.h。 事 实证 明 ， 对 各 种 各 样 的 标准 C 的 实现 ， 
它 已 经 足够 了 。 它 假设 调用 的 上 下 文 可 以 用 一 个 整 型 数组 来 存储 。 即 使 当 存 
储 的 上 下 文 包含 了 各 种 类 型 的 数据 对 象 的 时 候 ， 它 通常 也 这 样 做 。 内 部 头 文 
ft yvals 定义 了 宏 _NSETJMP， 这 个 宏 确 定 jmpbuf 中 的 元 素 个 数 。 


注意 <setjmp.h> 是 在 另 一 个 宏 (或 者 函数 ) _Setimp 的 基础 上 来 定 
XE setjmp， 内 部 头 文件 <yvals.h> 又 一 次 提供 了 所 需 的 信息 。 你 可 以 
把 宏 setjmo 定义 为 用 不 同 的 名 字 调 用 一 个 现 有 函数 的 宏 ， 或 者 你 可 以 把 
_Setjmp 声明 为 一 个 用 汇编 语言 实现 的 函数 。 但 你 不 能 提供 一 个 调用 另 一 个 
函数 的 丽 数 ，( 考 虑 一 下 这 一 点 。) 这 也 是 我 为 定义 宏 setjmp 提供 很 大 灵活 
度 的 原因 。 你 可 以 学 习 一 下 PC 兼容 机 下 的 Borland Turbo C++ 编译 器 ， 那 是 
一 个 很 好 的 例子 。 内 部 头 文件 <yvals.h> 可 能 会 包含 下 面 的 内 容 。 


#define _NSETUMP 10 
int Setjmp(int *); 


虽然 前 面 有 一 些 警告 ， 但 这 里 我 还 是 给 出 了 用 C 语言 编写 的 setjmp 和 
longjmp， 我 这 样 做 只 是 为 了 解释 其 中 的 原理 ， 不 和 要 在 一 个 严谨 的 实现 中 使 
用 这 些 代 码 ， 因 为 它 几 乎 不 能 工作 ， 它 只 适用 于 那些 具有 特殊 属性 的 实现 。 


口 调用 函数 的 调用 环境 和 其 他 动态 分 配 的 空间 都 存储 在 栈 顶 的 一 个 连续 
的 区 域 中 。 

D 调用 环境 包含 所 有 setimp 保留 和 longjmp 恢复 的 信息 。 可 以 通过 复 
制 固定 数量 的 字符 ， 来 可 靠 地 获得 这 些 信息 。 


#ifndef _SETJMP 

#define _SETJMP 

#ifndef  YVALS 

#include <yvale.h> 

#endif 
/* macros */ 

#define setjmp(env)  Setjmp(env) 
/* type definitions */ 

typedef int jmp buf[ NSETUMP]; 
/* declarations */ 

void longjmp(jmp buf, int); 


#endif 


/* setjmp.h standard header */ | 
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图 8-2 
setjmp.c 


O 部 分 调用 环境 是 调用 函数 保存 的 帧 指针 ， 这 些 被 保存 的 帧 指针 的 位 置 
跟 一 个 声明 的 动态 数据 对 象 的 位 置 之 间 有 一 个 固定 的 偏 移 量 ， 可 以 用 
来 定位 帧 指针 。 
D 如 果 调 用 环境 位 于 正确 的 位 置 ， 并 且 帧 指针 也 被 赋予 了 正确 的 值 ， 那 
么 函数 就 恢复 为 提供 调用 环境 的 调用 者 。 
很 多 C 语言 的 实现 都 满足 这 些 假设 ， 但 并 不 是 全 部 。 这 些 函 数 恰好 可 以 
在 VAX 体系 结构 下 工作 。 为 了 更 好 地 解释 它们 是 怎样 工作 的 ， 我 使 用 了 一 
些 参数 来 实现 它们 。 对 VAX 来 说 ， 头 文件 «yvals.h» 包含 以 下 的 宏 定义 : 


#define _JBFP 1 /* int offset of frame pointer */ 
#define _JBMOV 60 /* number of bytes in calling context */ 
#define _JBOFF 4 /* byte offset of calling context */ 
#define  |NSETJMP 17 /* number of ints in jmp_buf */ 


图 8-2 给 出 了 文件 setjmp.c， 它 定义 了 setjmp， 但 这 个 版 本 不 是 很 完 
善 。 这 个 函数 假设 它 可 以 把 栈 的 一 个 连续 的 空间 复制 到 jmp_buf 数据 对 象 
中 ， 并 且 能 保存 足够 数量 的 调用 环境 。 它 声明 了 很 多 register 数据 对 象 ， 
希望 借 此 可 以 强制 保存 所 有 具有 调用 上 下 文 的 重要 的 寄存 器 。 它 制造 了 一 个 
调用 Gummy 消 数 的 假象 ， 这 样 就 骗 过 了 一 些 优化 器 ， 这 些 优化 器 可 能 断定 那 
些 寄 存 器 从 没有 被 使 用 过 。 


/* setjmp function */ 
#include «setjmp.h» 
#include <string.h> 


static void dummy(int a, int b, int c, int d, int e, 
int f, int g, int h, int i, int j) 
{ /* threaten to use arguments */ 
H 


static int getfp(void) 
{ /* return frame pointer of caller */ 
int arg; 


return ((int) (&arg + _JBFP)); 
} 


int setjmp(jmp_buf env) 


{ /* gave environment for re-return */ 

register int a= 0, b=0, c=0, d=0, es 0; 

register int f = 0, g= 0, h=0, i= 0, j = 0; 

if (a) /* try to outsmart optimizer */ 
dummy la, b, c, d, e, f, g, h, i, j); 

env[1] = getfp(); 

memcpy ( (char *)&env[2], (char *)env[1] + _JBOFF, _JBMOV); 


( 
return (0); 


Pb. o 
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图 8-3 /* longjmp function */ 
longjmp.c #include «setjmp.h» 
finclude <string.h> 


Static void dummy(int a, int b, int c, int d, int e, 
int f, int g, int h, int i, int j) 
{ /* threaten to use arguments */ 


} 


static void setfp(int fp) 


{ /* set frame pointer of caller */ 
int arg; 


(&arg) [_JBFP] = fp; 
} 


static int dojmp(jmp buf env) 
{ /* do the actual dirty business */ 
memcpy((char *)env[1] + JBOFF, (char *)&env[2], _JBMOV); 
setfp(env[1]); 
return (env[0]); 
} 


void longjmp(jmp_buf env, int val) 


{ /* re-return from setjmp */ 

register int a= 0, b=0,c=0,d=0,e=0; 

register int f = 0, g = 0, h= 0, i-0, j= 0: 

if (a) /* try to outsmart optimizer */ 

dummy(a, b, c, d, e, f. g, h, i, j); 

env[0] = val ? val : 1; 

dojmp(env); 

} 口 
函数 longjmp 图 8-3 是 文件 1ongjmp.c。 它 定义 了 longjmp 的 一 个 更 差 的 版 本 。 这 个 


丽 数 把 已 保存 的 调用 环境 重新 复制 回 栈 中 。 它 和 setjmp 一 样 分 配 寄存 器 并 
且 叉 调用 了 另 一 个 函数 ， 目 的 是 希望 这 种 大 量 的 复制 不 会 和 栈 的 任何 有 效 使 
用 的 部 分 重要 。 然 后 它 设 置 帧 指针 ， 和 希望 可 以 把 控制 权 返回 给 调用 setjmp 
的 函数 ， 而 不 是 它 的 真正 调用 者 。 

如 果 一 切 顺利 的 话 〈 很 多 原因 都 会 造成 一 些 问题 )， 执 行 会 在 setjmp 
第 一 次 调用 的 地 方 重新 开始 。 这 种 情况 下 ，setjnme 的 返回 值 就 是 提供 给 
longjmo 的 一 个 参数 值 。 

这 两 个 是 数 的 完整 的 实现 一 定 要 更 加 严密 。 例 如 ， 它 也 会 考虑 到 以 下 内 
容 〈 关 于 其 他 的 东西 ): 

O 浮 点 协 处 理 器 的 状态 ; 

O 傍 号 处 理 需 是 否 处 于 活动 状态 。 
你 会 发 现 这 些 琐 数 的 正确 版 本 使 用 了 很 多 的 技巧 ， 只 是 变 得 更 加 可 靠 。 


<setjmp.h> 


/* test setjmp functions */ 
finclude <assert.h> 
#include <setjmp.h> 
#include <stdio.h> 


/* static data */ 
static int ctr; 
static jmp_buf b0; 


static void jmpto(int n) 
{ 
longjmp(b0, n); 
) 


static char *stackptr(void) 
{ 


char ch; 


return (&ch;) 


} 


static int tryit (void) 
{ 
jmp buf bl; 
char *sp = stackptr(); 


ctr = 0; 
switch (setjmp (b0) ) 
H 
case 0: 
assert(sp == stackptr()); 
assert(ctr == 0); 
**ctr; 
jmpto(0); 
break; 
case 1: 
assert(sp == stackptr()); 
assert(ctr == 1); 
++ctr; 
jmpto(2); 
break; 
case 2: 
assert(sp == stackptr()); 
assert(ctr == 2); 
++Ctr; 
switch(setjmp(b1)) 
{ 


case 0: 


assert(sp == stackptr()); 
assert (ctr == 3); 
++ctr; 


longjmp (bl, -7); 
break; 


/* jump on static buffer */ 


/* test for stack creep */ 


/* exercise jumps */ 


/* jump among cases */ 


/* should return 1 */ 


/* test nesting */ 


8.5 <setjmp.h> 的 测试 191 


图 8-4 
( 续 ) 


case -7: 
assert (sp == stackptr()); 
assert (ctr == 4); 
++ctr; 
jmpto(3); 
case 5: 
return (13); 
default: 
return (0); 
H 
case 3: 
longjmpí(bi, 5); 
break; 
) 
return (-1); 
H 
int main() 
H /* test basic workings of setjmp functions */ 
assert(tryit() == 13); 
printf("sizeof(jmp buf) = %u\n", sizeof (jmp buf)); 


puts("SUCCESS testing «setjmp.h»"); 
return (0); 


[> 口 


8.5 «setjmp.h» 的 测试 


栈 蔓延 


图 8-4 是 文件 tsetjmp.c， 它 似乎 不 只 是 一 个 功能 测试 ， 而 更 多 的 是 对 
setjmp 和 longjmp 的 测试 。 我 想 你 可 能 会 自己 试 着 用 汇编 语言 实现 这 些 画 
数 。 根 据 我 的 经 历 ， 要 想 找 出 这 些 代码 中 的 bug， 必 须要 进行 非常 严密 的 测 
试 ， 测 试用 例 越 繁琐 越 好 。 


注意 ， 这 些 代码 反复 地 测试 栈 蔓 延 。 如 果 不 能 把 调用 栈 准 确 地 恢复 到 一 
个 早期 的 状态 ， 就 会 出 现 这 种 情况 。 很 多 时 候 你 会 把 各 种 垃圾 留 在 栈 中 而 且 
在 很 长 一 段 时 间 内 不 去 管 它 。 只 有 当 你 的 程序 不 经 意 间 把 栈 空间 用 完 ， 或 者 
发 生 了 其 他 形式 的 错误 时 ， 你 才 开 始 怀疑 这 样 的 问题 。 最 好 早点 发 现 它们 。 


为 了 美观 ， 程 序 也 显示 了 类 型 为 jmp_buf 的 数据 对 象 的 大 小 。 当 
testjmp.c 正确 执行 时 ， 它 会 显示 类 似 下 面 的 信息 : 


sizeof (jmp-buf) = 20 
SUCCESS testing <setjmp.h> 


如 果 中 间 发 生 了 错误 ， 这 个 程序 可 能 会 暂停 或 者 异常 终止 ， 它 甚至 会 显示 一 
条 有 用 的 错误 信息 。 


192 第 8 章 


<setjmp.h> 


86 ”参考 文献 


87 ”习题 


8.1 


8.2 


8.3 


8.4 


8.5 


8.6 


ISO/IEC Standard 71 85:1990 (Geneva:International Stantards Organization, 1990). 
这 个 标准 定义 了 Pascal 程序 设计 诸 言 ， 这 种 语言 允许 使 用 非 本 地 goro 指向 一 
AF Deg. 

ISO/IEC Standard 6160:1979 (Geneva:International Stantards Organization, 1979). 
这 个 标准 定义 了 PLA 程序 设计 语言 ， 这 种 语言 允许 使 用 具有 标号 变量 的 非 本 
Hb goto. 


你 使 用 的 C 翻译 器 是 怎样 定义 jmp but 类 型 的 ? 你 可 以 把 它 安全 地 用 整 型 数 
组 表示 出 来 吗 ? 如 果 可 以 ， 该 数组 必须 有 多 少 个 元 素 ? 


编写 可 以 在 你 的 翻译 器 下 工作 的 longjmp 和 setjmp IKA. 
修改 在 前 面 的 习题 中 所 编写 的 程序 ， 检 查 一 些 比较 明显 的 用 法 错误 。 


口 把 一 个 校 验 和 或 者 其 他 的 签名 存储 在 每 一 个 jmp_buf 类 型 的 数据 对 象 中 ， 
然后 在 你 相信 剩余 的 内 容 之 前 检查 它们 。 

O 确保 调用 栈 至 少 和 它 的 内 容 存 储 在 jmp_buf 类 型 的 数据 对 象 中 的 时 候 一 样 
大 。 


你 还 能 想 出 其 他 什么 样 的 检查 方法 ? 

[XE] 异常 处 理 程序 是 当 报 告 或 发 生 了 一 个 异常 时 ， 可 以 获得 控制 权 的 代码 段 。 
在 一 个 给 定 的 上 下 文 环境 中 ， 除 了 注册 一 个 异常 的 编码 值 之 外 还 要 注册 处 理 
器 。 任 何 因 为 相同 的 异常 编码 值 而 被 注册 的 异常 处 理 程序 都 被 屏蔽 了 【〔 换 句 
话说 ， 在 栈 中 注册 了 )。 当 上 下 文 环境 结束 时 ， 就 可 以 把 该 处 理 程序 注销 ， 
然后 就 会 显示 出 所 有 前 面 的 异常 处 理 程序 。 一 个 处 理 程序 可 以 注册 处 理 任 何 
情况 的 请 求 ， 也 可 以 重新 引发 一 个 异常 一 一 把 它 向 上 传递 给 以 前 注册 的 处 理 
程序 。 如 果 对 一 个 给 定 的 编码 值 ， 没 有 任何 注册 的 处 理 程序 ， 那 么 程序 就 会 
异常 终止 ， 输 出 一 条 讨厌 的 信息 。 设 计 忒 数 when 和 raise 来 实现 异常 处 理 。 
when 可 以 注册 和 注销 处 理 程序 ，raise 可 以 报告 异常 。 使 用 这 样 的 吨 数 有 什 
么 好 处 ? 

[ 难 ] 实现 你 在 上 一 道 习 题 中 设计 的 立 数 。 

[很 难 ] 定义 可 以 消除 本 章 前 面 描 述 的 问题 的 setjmp 和 longjmp 的 语义 。 使 
得 你 可 以 从 一 个 任意 的 表达 式 中 调用 setjmp， 而 且 所 有 的 数据 对 象 都 不 受 
longjmp 调用 的 影响 。 相 应 地 修改 标准 C VEE. 


9.1 背景 知 


头 文件 


<signal.h> 


raise 


signal 


信和 号 处 理 程 序 


<signal.h> 


信号 是 程序 执行 过 程 中 发 生 的 异常 事件 。 同 步 信 号 的 产生 是 因为 程序 自 
再 的 菜 些 动作 ， 例 如 除 零 或 不 正当 地 访问 存储 器 。 异 步 信 号 是 由 程序 外 部 的 
行为 引起 的 。 比 如 有 人 敲 击 了 提示 键 ， 或 者 另外 一 -个 程序 (异步 地 执行 ) 给 
你 的 程序 发 信号 ， 都 会 引发 一 个 异步 信号 。 


时 序 不 能 屏蔽 的 信号 要 求 立 即 得 到 处 理 。 如 果 不 对 发 生 的 信号 指定 C 
处 理 方 法 ， 那 么 它 就 会 被 作为 一 种 致命 错误 对 待 ， 然 后 程序 就 会 以 失败 的 状 
态 终 上 小 执行 。 在 某 些 实现 中 ， 这 些 状态 反映 了 信号 的 类 型 。 另 外 ，C 标准 库 
会 在 程序 终止 之 前 向 标准 错误 流 输出 一 条 错误 信息 。 

头 文件 <signal.h> 定义 了 一 个 无 穷 信 和 对 集 的 各 种 编码 值 。 它 也 声明 了 

O äi raise, 报告 “个 同步 信和 号; 

O mër signal， 可 以 指定 一 种 信和 与 的 处 理 方法 。 


可 以 通过 以 下 3 种 方式 处 理 信号 。 

D 默认 处 理 是 终止 程序 ， 就 像 上 | 自 所 描述 的 那样 。 

口 信号 忽略 是 直接 把 它 丢 弃 。 

C) 信号 处 理 是 把 控制 权 转 移 给 一 个 指定 的 函数 。 

在 地 后 一 种 情况 下 ， 那 个 指定 的 函数 叫做 信号 处 理 程序 。C 标准 库 在 遇 到 
一 个 报告 的 信号 时 ， 就 会 调用 相应 的 信号 处 理 程序 ， 程 序 的 正常 执行 就 会 被 挂 
起 。 如 洒 信 号 处 理 程序 把 控制 权 返 回 给 调用 者 ， 程 序 就 会 从 它 被 挂 起 的 那个 点 
继续 执行 。 除 了 延迟 和 信和 号 处 理 程序 造成 的 任何 变化 ， 程 序 的 行为 不 受 影 啊 。 


这 听 起 来 像 是 一 个 很 好 的 机 制 ， 但 实际 上 并 非 如 此 。 一 个 信号 的 发 生 义 
会 在 程序 内 部 引入 控制 线程 ， 这 会 引发 程序 的 同步 和 可 靠 性 拘 作 方面 的 各 种 
问题 ， 伺 C 标准 对 这 两 方面 都 不 是 很 重视 。C 程序 从 语言 发 展 的 早期 就 开 
始 处 理 信号 了 。 然 而 ， 一 个 可 移植 的 程序 却 儿 乎 不 能 安全 地 使 用 信号 处 理 各 
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<signal.h> 


volatile 


数据 对 象 


sig atomic t 


类 型 


问题 


一 个 问题 是 C 标准 库 本 身 。 如 果 用 一 个 有 效 的 参数 值 调 用 〈 库 函数 )， 
没有 库 函 数 会 产生 一 个 同步 信号 。 但 是 库 执行 的 时 候 却 可 能 发 生 异 步 信号 。 
例如 ， 这 个 信号 可 能 会 通过 一 个 打印 操作 挂 起 程序 的 执行 。 信 和 号 处 理 程序 应 
该 输出 一 条 消息 ， 但 输出 流 可 能 会 在 一 种 迷惑 的 状态 下 结束 。 还 没有 一 种 方 
法 可 以 在 信号 处 理 程序 内 部 确定 某 一 个 库 函 数 是 否 处 于 不 安全 的 状态 。 

另 一 个 问题 是 关于 声明 为 volatile 类 型 的 数据 对 象 。 这 会 警告 翻译 器 ， 
可 能 会 有 意 想 不 到 的 实体 访问 这 个 数据 对 象 ， 所 以 对 这 样 的 数据 对 象 进行 访 
问 时 一 定 要 很 小 心 。 特 别 地 ， 它 也 要 知道 把 对 volatile 数据 对 象 的 访问 移 到 某 
些 序列 点 之 外 时 不 能 进行 优化 。 当 然 ， 一 个 信号 处 理 程序 就 是 一 个 意 想不到 
的 实体 。 因 此 ， 应 该 把 在 信号 处 理 程序 内 访问 的 所 有 数据 对 象 声 明 为 volatile 
类 型 ， 如 果 信 和 号 是 同步 的 而 且 发 生 在 数据 对 象 没 有 被 访问 的 两 个 序列 点 之 间 ， 
那么 这 样 做 是 有 好 处 的 。 然 而 ， 对 于 异步 信号 而 言 ， 多 少 保护 都 是 不 够 的 。 
信和 号 不 能 仅仅 被 限制 为 只 在 某 些 序列 点 挂 起 程序 的 执行 。 

C 标准 对 编写 可 靠 的 信号 处 理 程 序 问题 提供 了 部 分 的 解决 方法 。 头 文 
fF <signal,h> 定义 了 sig atomic t 类 型 ， 它 是 一 个 程序 以 原子 方式 访问 
的 整数 类 型 。 一 个 信号 在 程序 访问 这 种 类 型 的 数据 对 象 的 过 程 中 ， 决 不 会 挂 
起 程序 的 执行 。 一 个 信号 处 理 程序 能 和 程序 的 其 他 部 分 共享 的 仅仅 有 声明 为 
volatile sig atomic, t 类 型 的 数据 对 象 。 

作为 一 种 传达 信息 的 方法 ， 信 号 还 有 很 多 有 待 改 进 的 地 方 。 标 准 C 中 对 
信号 的 详细 说 明 是 以 它们 在 早期 的 UNIX 操作 系统 下 的 行为 为 基础 的 。 该 系 
统 在 处 理 信号 的 方式 上 有 很 多 严重 的 漏洞 。 

D 有 多 种 信号 可 能 会 丢失 。 该 系统 没有 把 信号 放 到 队列 中 ， 而 上 只 是 记 住 

了 最 后 报告 的 信号 。 如 果 在 信和 号 处 理 程序 处 理 一 个 信号 之 前 ， 又 有 一 
个 信号 发 生 了 ， 那 么 就 会 有 一 个 信号 被 忽略 。 

D 一 个 程序 甚至 在 它 努 力 处 理 所 有 的 信号 的 时 候 都 有 可 能 被 终止 。 当 控 
制 权 第 一 次 传递 给 信号 处 理 程序 时 ， 它 对 那个 信号 的 处 理 恢 复 为 默认 
行为 ， 信 号 处 理 程序 必须 调用 signal 来 使 它 自己 复位 为 该 信号 的 处 
理 程序 。 当 信号 发 生 在 进入 信号 处 理 程 序 和 调用 signal 之 间 时 ， 默 
认 的 处 理 程序 就 会 得 到 控制 权 并 终止 程序 。 

D 目前 还 不 存在 一 种 机 制 可 以 专门 终止 一 个 信号 的 处 理 。 在 其 他 的 操作 
系统 中 ， 程 序 输入 一 个 特殊 的 状态 ， 当 信号 处 理 程序 报告 完成 当前 的 
处 理 后 ， 后 续 信和 号 的 处 理 才 能 顺利 进行 。 在 这 样 的 系统 中 ， 其 他 的 函 
数 可 能 会 适当 地 辅助 对 信号 的 正确 处 理 。 这 些 函 数 包括 <stdlib.h> 
中 声明 的 abort 和 exit 以 及 <setjmp.h> 中 声明 的 longjmp。 

另外 ， 在 任何 计算 机 上 ， 信 号 都 是 由 各 种 奇怪 的 原因 引起 的 。C 标准 
中 命名 的 这 些 原因 是 UNIX 所 支持 的 命名 的 一 个 子 集 ， 而 这 些 又 起 源 于 为 
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可 移植 性 


PDP-11 定义 的 中 断 和 陷阱 。 把 一 个 给 定 的 计算 机 的 信和 号 源 和 标准 C 中 定义 
的 对 应 起 来 经 常 是 任意 的 ， 把 一 个 给 定 的 操作 系统 的 信号 处 理 语义 和 标准 C 
中 的 对 应 起 来 就 更 随意 了 。 

C 标准 不 得 不 削弱 已 经 很 弱小 的 UNIX 信和 号 的 语义 来 使 它 可 以 适应 各 种 
各 样 的 操作 系统 : 

DO 一 个 指定 的 信号 可 能 永远 都 不 会 发 生 ， 除 非 用 raise RAE: 

D 一 个 指定 的 信号 可 能 会 被 忽略 ， 除 非 你 用 signal 来 激活 它 ; 
其 他 的 就 没什么 了 。 

因此 ， 对 <signal.h> 中 声明 的 函数 不 能 完全 安全 地 定义 一 种 可 移植 的 
用 法 。 原 则 上 ， 可 以 为 一 个 只 有 raise 报告 的 信号 指定 一 个 处 理 程 序 ， 但 很 
难 想象 它 哪 些 方面 比 <setjmp.h> 中 声明 的 setjmp 和 longjmp 工作 得 更 好 。 
另外 ， 也 不 能 保证 一 个 指定 的 信号 在 C 的 所 有 实现 中 都 不 会 被 报告 。 所 以 ， 
不 管 什么 时 候 程序 处 理 信 号 ， 它 的 可 移植 性 都 会 受到 限制 。 


9.2 _C 标准 的 内 容 


<signal.h> 


sig atomic t 


SIG DFL 
SIG ERR 
SIG IGN 


SIGABRT 
' SIGFPE 
SIGILL 
SIGINT 
SIGSEGV 
SIGTERM 


7.7 信和 号 处 理 <signal.h> 


头 文件 «signal.h» 为 处 理 各 种 各 样 的 信号 (程序 执行 过 程 中 可 能 被 报告 的 情况 、 声 
明了 一 个 类 型 和 两 个 函数 ， 并 定义 了 几 个 宏 。 
定义 的 类 型 是 : 
sig atomic t 
该 类 型 是 整数 类 型 ， 声 明 为 这 种 类 型 的 对 象 可 以 作为 一 个 原子 实体 被 访问 ， 即 使 有 异 
步 中 断 发 生 的 时 候 也 是 如 此 。 
定义 的 宏 有 : 
SIG_DFL 


SIG_ERR 
SIG_IGN 


它们 展开 为 具有 不 同 值 的 常量 表达 式 ， 这 些 表达 式 的 类 型 和 永 数 signal 的 第 二 个 参 
数 及 返回 值 的 类 型 兼容 ， 并 且 它 们 的 值 与 所 有 声明 的 函数 的 地 址 都 不 相等 。 下 面 的 每 个 宏 
都 展开 为 正 的 整 值 常 数 表达 式 ， 它 们 是 和 各 种 指定 的 情况 对 应 的 信号 编号 。 

SIGABRT 异常 终止 ， 比 如 执行 了 abort 函数 。 

SIGFPE 错误 的 算术 操作 ， 比 如 除 零 或 者 导致 溢出 的 操作 。 

SIGILL 检测 到 无 效 的 函数 映 象 ， 比 如 一 条 非法 指令 。 

SIGINT 收 到 一 个 交互 的 提示 信号 。 

SIGSEGV 对 存储 器 的 无 效 访问 。 

SIGTERM 送 到 程序 中 的 终止 请 求 。 

除了 作为 直接 调用 raise 函数 产生 的 结果 ， 实 现 不 需要 生成 这 些 信 和 号 中 的 任何 一 个 。 
实现 也 可 以 使 用 宏 定 义 来 指定 附加 的 信号 和 指向 未 声明 的 函数 的 指针 ， 这 些 宏 的 名 字 分 别 
以 SIG 和 一 个 大 写字 母 或 SIG_ 和 一 大 写字 母 开头 '”“。 信 号 的 完整 集合 、 信 号 的 语义 和 信 
号 的 默认 处 理 方法 是 由 实现 定义 的 。 所 有 的 信号 编号 都 应 该 是 正 数 。 


<signal.h> 


signal 


raise 


7.7.1 指定 信号 处 理 
7.7.1.1 函数 signal 
概述 
#include <signal.h> 
void (*signal(int sig, void (*func) (int) ) ) (int) ; 
说 明 
函数 signal 通过 3 种 方式 来 保证 接收 到 的 信号 编号 sig 被 依次 处 理 。 如 果 func 的 值 
是 SIG_DFL， 那 么 就 会 使 用 默认 的 信号 处 理 方式 ， 如 果 func 的 值 是 SIG_IGN， 那 么 这 个 信 
号 就 会 被 忽略 ， 否 则 ，func 就 指向 一 个 函数 ， 当 这 个 信号 发 生 时 ， 就 调用 这 个 函数 ， 这 样 
的 函数 被 称 为 信号 处 理 程序 。 
当 一 个 信号 发 生 时 ， 如 果 func 指向 一 个 函数 ， 首 先 执 行 和 signal (sig, SIG DFL); 
等 价 的 语 TSR TIL SUNE MÅ sig KA SIGILL, RER SIG DEL Å 
实现 定义 的 .) 然后 执行 和 (func) (sig); 等 价 的 语句 。 函 数 func 可 以 通过 return 语句 
或 者 调用 函数 abort, exit 或 longimp 来 终止 。 如 果 func 执行 return 语句 并 且 sig 的 
值 是 SIGFPE 或 者 任何 其 他 的 由 实现 定义 的 与 计算 异常 对 应 的 值 ， 那 么 这 种 行为 未 定义 ; 
否则 ， 程 序 会 在 它 被 中 断 的 位 置 重新 执行 。 
如 果 发 生 了 一 个 信号 ， 但 不 是 调用 函数 abort 或 者 raise 产生 的 结果 ， 而 且 信 号 处 
理 程序 调用 了 signal 函数 〈 函 数 的 第 一 个 参数 是 开启 信号 处 理 程 序 的 信号 编号 ) 之 外 的 
其 他 标准 库 函 数 ， 或 者 引用 了 任何 具有 静态 存储 期 的 对 象 ， 而 不 是 通过 为 一 个 volatile 
sig atomic t 类 型 的 静态 存储 变量 赋值 ， 那 么 这 种 行为 未 定义 。 而 且 ， 如 果 对 signal Å 
数 的 调用 导致 了 返回 值 为 SIG_ERR， 则 errno 的 值 是 不 确定 的 m 
在 程序 启动 时 ， 可 以 执行 与 下 面 等 价 的 语句 
signal(sig, SIG IGN) 
来 处 理 某 些 按照 实现 定义 的 方式 选择 的 信号 。 热 行 与 下 面 等 价 的 语句 
signal(sig, SIG DFL) 
来 处 理 实现 定义 的 其 他 所 有 信号 。 
实现 的 行为 不 受 调用 函数 signal 的 影响 ， 即 与 没有 库 函 数 调 用 signal 时 的 行为 相同 。 
返回 值 
如 果 响 应 了 请 求 的 话 ， 函数 signal 返回 对 指定 的 信号 sig 最 后 一 次 调用 signal 的 
func 的 值 ， 否 则 ， 返 回 SIG ERR 的 值 并 且 在 errno 中 存储 一 个 正 值 。 
SN: mR abort (7.10.4.1) 和 函数 exit (7.10.4.3)。 
7.7.2 发 送信 号 
7.7.2.1 函数 raise 
概述 


#include <signal.h> 
int raise(int sig); 


说 明 

函数 raise 把 信号 sig 送 给 正在 执行 的 程序 。 
返回 值 

执行 成 功 ， 函 数 raise 返回 零 ， 否 则 ， 返 回 非 零 。 
脚注 


108. 参考 “ 库 的 展望 ”(7.13.5)。 信 号 编号 的 名 字 分 别 表示 以 下 含义 ， 异 常 中 止 、 浮 
点 异常 、 非 法 指令 、 中 断 、 段 越界 和 终止 。 
109. 如 果 所 有 的 信号 都 是 由 异步 信号 处 理 程序 产生 的 ， 那 么 这 种 行为 未 定义 。 
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9.3 «signal.h» 的 使 用 


从 本 质 上 说 ， 信 号 处 理 是 不 可 移植 的 。 只 有 当 必 须 指定 一 个 已 知 的 操作 
系统 集 的 信号 处 理 时 ， 才 能 使 用 <signal .h> 中 声明 的 函数 。 不 用 费 尽 心思 
把 代码 变 成 通用 的 ， 这 是 不 可 能 的 。 


如 果 对 一 个 信号 的 默认 处 理 是 可 行 的 ， 那 么 就 选择 这 种 处 理 方法 。 使 
用 自己 的 信号 处 理 程序 会 降低 可 移植 性 并 且 可 能 导致 程序 对 信号 的 误 处 理 增 
多 。 如 果 必 须 提 供 某 个 信号 的 处 理 程序 ， 对 其 进行 分 类 如 下 : 


D 不 能 返回 值 的 信号 处 理 程序 ， 比 如 像 SIGFPE 这 样 报 告 算术 异常 或 者 
像 SIGABRT 这 样 报告 致命 错误 。 

O 必须 返回 值 的 信号 处 理 程序 ， 像 SIGINT 这 样 ， 报 告 一 个 可 能 已 经 中 
断 某 种 库 操作 的 提示 中 断 。 

我 们 规定 ， 第 二 类 中 包括 不 会 立即 导致 程序 终止 的 异步 信号。 几乎 所 有 
的 信号 都 能 归 到 这 两 类 中 。 

不 能 返回 值 的 信号 处 理 程序 最 后 会 调用 abort, exit 或 者 1ongjmp 来 结 
束 。 当 然 ，SIGABRT 的 处 理 程序 不 能 调用 abort 来 结束 。 处 理 程序 不 应 该 调 
用 signal 使 自己 重建 。 如 果 程 序 没 有 终止 ， 就 把 剩 下 的 工作 留 给 其 他 的 冰 
数 。 如 果 信 和 号 是 异步 的 ， 要 注意 程序 所 有 的 输入 输出 ， 因 为 这 样 的 操作 也 会 
中 断 库 的 执行 。 

必须 返回 的 信号 处 理 程序 用 一 个 return 语句 结束 。 如 果 它 想 让 自己 复位 ， 
那么 应 该 在 入 口 处 立即 返回 。 如 果 信 号 是 异步 的 ， 就 在 一 个 sig_atomic t 
KWH volatile 数据 对 象 中 存储 一 个 非 零 值 。 不 要 执行 其 他 任何 对 正在 执行 
的 程序 有 副作用 的 动作 ， 例 如 输入 输出 和 访问 其 他 的 数据 对 象 。 


下 面 是 -- 个 异步 信号 处 理 程序 的 例子 ; 


finclude <signal.h> 
static sig atomic t intflag = 0; 


static void field int(int sig) 
( /* handle SIGINT */ 
Signal(SIGINT, &field int); 
intflag = 1; 
return; 
) 


这 个 程序 调用 signal (SIGINT,&field int) 来 创建 处 理 程 序 。 它 会 不 时 地 
执行 下 面 的 代码 来 检查 是 否 发 生 了 异步 交互 式 提 示 中 断 : 
if (intflag) 


( /* act on interrupt */ 
intflag - 0; 


) 
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<signal.h> 


SIGABRT 


SIGFPE 


SIGINT 


SIGSEGV 


SIGTERM 


注意 这 些 信号 可 能 会 在 两 个 地 方 出 错 : 


口 调用 signal gu, field_int 内 部 出 现 SIGINT 可 能 会 终止 程序 。 
OQ 在 测试 和 清除 intflag 之 间 出 现 的 SIGINT BY GER EK, 


这 些 都 是 信号 固有 的 局 限 性 。 


下 面 是 对 信号 的 一 个 简单 的 描述 ， 它 适用 于 所 有 标准 C 的 实现 ， 但 一 
个 具体 的 实现 可 能 会 定义 更 多 的 东西 。 后 面 也 显示 了 <signal.h> 中 定义 的 
其 他 宏 名 的 内 容 ， 这 些 宏 都 以 SIG 开头 ， 它 们 都 应 该 展开 为 表示 其 他 信和 号 的 
OND) 正 整数 。 


SIGABRT -一 当 程序 异常 终止 时 ， 例 如 显 式 地 调用 <stdlib.h> 中 的 
abort， 就 会 产生 这 个 信号 。 不 要 忽略 这 个 信和 号。 如果 读 者 自己 提供 一 个 处 
理 程 序 ， 就 尽 可 能 少 地 执行 操作 ， 用 一 个 return 语句 或 者 调用 <stdlib.h> 
中 的 函数 exit 来 结束 这 个 处 理 程序 。 


SIGFPE 一 一 这 个 名 字 的 原意 是 “ 浮 点 异常 ”，C 标准 把 这 个 信号 推广 为 
包括 所 有 的 算术 异常 ， 例 如 上 浇 、 下 溢 或 者 除 零 。 各 种 实现 报告 的 异常 类 型 
区 别 也 很 大 ， 但 几乎 没有 实现 会 报告 整 型 溢出 。 但 也 不 能 轻易 地 忽略 这 个 信 
号 ， 这 个 信号 的 处 理 程序 不 能 有 返回 值 。 

SIGINT 一 一 这 是 报告 异步 交互 式 提示 信号 的 常规 方法 。 大 多 数 系 统 都 会 
提供 一 些 组 合 键 来 生成 这 样 的 信号 ， 例 如 cl-C、DEL 和 ATTN。 它 为 提早 结 
东 烦 人 的 循环 提供 了 一 种 方便 的 途径 。 但 是 ， 异 步 信 号 可 能 会 在 一 个 程序 的 
原子 操作 过 程 中 打 断 它 。 如 果 处 理 程序 不 返回 控制 权 ， 后 来 的 程序 可 能 会 产 
生 错 误 的 行为 。 所 以 ， 忽 略 这 个 信和 号 还 是 很 安全 的 。 


SIGSEGV 一 一 这 个 名 字 的 原意 是 “ 段 越界 ” 因为 PDP-11 把 内 存 作 为 段 
的 集合 来 管理 。C 标准 把 这 个 信号 推广 为 包括 所 有 无 效 的 存储 访问 引起 的 异 
常 。 例 如 程序 尝试 用 错误 的 函数 指示 符 或 者 左 值 访 问 C 定义 的 所 有 函数 和 数 
据 对 象 之 外 的 存储 区 域 ， 或 者 程序 尝试 把 值 存储 在 const 类 型 的 数据 对 象 中 。 
在 这 些 事件 中 ， 程 序 不 能 继续 安全 地 执行 。 不 要 忽略 这 个 信号 或 者 从 它 的 处 
理 程序 中 返回 。 


SIGTERM 一 一 这 个 信号 传统 上 是 由 操作 系统 或 者 另 一 个 异步 程序 发 出 的 ， 
一 定 要 把 它 当 作 终 止 程序 执行 客气 而 坚定 的 请 求 。 它 是 一 个 异步 信号 ， 所 以 
它 可 能 会 在 程序 的 不 恰当 的 位 置 点 发 生 ， 所 有 有 时 候 会 想 用 上 面 描述 的 技术 
来 使 它 延迟 。 忽 略 这 个 信号 是 很 安全 的 ， 尽 管 这 样 做 有 点 不 太 “ 礼 貌 ”。 
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9.4 <signal.h> 的 实现 


头 文件 


<yvals.h> 


UNIX 版 本 


图 9-1 所 示 是 文件 signal.h， 这 里 给 出 的 头 文件 <signal.h> 是 最 小 
的 。 例 如 UNIX 系统 就 定义 了 几 十 个 信号 。 而 且 在 这 点 上 ， 很 多 系统 都 努力 
向 UNIX 看 齐 。 所 以 ， 即 使 它们 不 能 产生 这 么 多 信和 号， 它们 还 是 定义 了 这 些 
信和 号。 尽管 努 力 使 行为 保持 一 致 ， 信 号 的 选择 和 编码 方式 仍 变化 很 大 。 这 里 
我 尽量 选择 使 用 最 广泛 的 编码 值 。 

和 以 前 一 样 ， 我 使 用 内 部 头 文件 <yvals h> 提供 在 不 同 的 系统 之 间 变 
化 很 大 的 参数 。 例 如 SIGABRT 的 编码 和 最 有 效 的 信号 编码 。 这 个 实现 中 的 
某 些 函数 使 用 宏 _NSIG 来 确定 无 效 的 信号 编码 的 最 小 正 数 。 因 此 ， 头 文件 
«yvals.h» 在 这 里 定义 了 两 个 重要 的 宏 。 对 一 个 典型 的 UNIX 系统 来 说 ， 这 
两 个 定义 是 : 

#define _SIGABRT 6 

#define _SIGMAX 32 


头 文件 <signal.h> 对 广泛 使 用 的 UNIX 习惯 做 了 一 些 让 步 。 所 以 ， 它 
定义 宏 SIG ERR 和 宏 SIG IGN 的 方式 就 有 点 不 太 舒 服 。 在 某 些 实现 中 ， 
值 -1 和 1 可 能 是 有 效 的 函数 地 址 。 当 然 ， 这 种 可 能 性 很 小 。 假 如 这 种 可 能 
性 成 立 ， 连 接 器 也 一 定 可 以 避免 这 种 情况 ， 并 且 其 他 的 值 会 更 容易 使 用 。( 例 
MN, signal fil raise 的 地 址 就 不 可 能 指定 有 用 的 信号 处 理 程序 。) 但 是 这 里 
选择 的 值 是 在 UNIX 实现 中 广泛 使 用 的 ， 其 他 的 操作 系统 也 模仿 UNIX 使 用 
这 些 值 。 所 以 我 选择 它们 是 为 了 能 和 现 有 的 体制 兼容 。 

IX PSR GE EH VER. ft signal 和 raise 几乎 一 定 要 修改 
以 适应 每 个 操作 系统 。UNIX 是 一 个 极端 的 例子 。 在 这 种 环境 下 ， 系 统 服务 
signal 完成 所 有 的 工作 。 如 果 想 访问 同名 的 C 可 调用 的 函数 ， 只 要 把 这 里 
给 出 的 代码 去 掉 就 可 以 了 。 可 以 让 其 他 的 函数 直接 调用 它 。 如 果 系 统 服 务 有 
一 个 私有 的 名 字 ， 例 如 _signal， 那 么 ， 就 可 以 把 signal 编写 为 : 


/* signal function -- UNIX version */ 
finclude <signal.h> 


_Sigfun * Signal(int,  Sigfun Si 


-Sigfun *(signal)(int sig,  Sigfun *fun) 
( /* call the system service 
return ( Signal(sig, fun)); 


) 
当然 也 可 以 把 它 定 义 为 «signal.h» 中 的 一 个 屏蔽 宏 来 使 用 。 


函数 raise 会 更 难 一 点 ， 它 使 用 系统 服务 ki11 来 给 自己 发 送 一 个 信和 号 。 
(kill 早期 只 发 送 SIGKILL 信号 ， 所 以 不 能 只 从 它 的 字面 上 理解 它 的 功能 。) 


一 般 的 版 本 


函数 raise 


<signal.h> 


/* signal.h standard header */ 
#ifndef SIGNAL 
*define SIGNAL 
#ifndef  YVALS 
#include <yvals.h> 
fendif 
/* type definitions */ 
typedef int sig atomic t; 
typedef void _Sigfun(int); 
/* signal codes */ 
#define SIGABRT_SIGABRT 
#define SIGINT 2 
#define SIGILL 4 
#define SIGFPE 8 
#define SIGSEGV 11 
#define SIGTERM 15 
#define _NSIG _SIGMAX /* one more than last code */ 
/* signal return values */ 
#define SIG_DFL(_Sigfun *)0 
#define SIG_ERR(_Sigfun *)-1 
#define SIG_IGN(_Sigfun *)1 
/* declarations */ 
int raise(int); 
.Sigfun *signal(int, _Sigfun *); 
fendif 口 


为 了 识别 它 自己 ，raise 还 需要 使 用 系统 服务 getpid。 假 设 这 两 个 系统 服务 
使 用 合适 的 私有 和 名字， 例如 Kill 和 _Getpid， 那 么 就 可 以 用 下 面 的 代码 实 
现 raise: 


/* raise function -- UNIX version */ 
include <signal.h> 


int _Getpid (void); 
int  Raise(int, int); 


int (raise) (int sig) 
( /* raise a signal */ 
return ( Kill( Getpid(), sig)); 
) 


这 个 也 可 以 定义 为 <signal.h> 中 的 一 个 屏蔽 宏 。 


我 选择 的 signal 和 raise 的 正式 版 本 使 用 更 广泛 。 但 是 它们 没有 提供 
标准 C 的 信号 和 操作 系统 的 信号 之 间 的 对 应 关系 ， 因 此 就 不 能 被 推广 。 不 过 
它们 提供 了 添加 具体 操作 系统 编码 的 功能 。 那 些 不 按照 UNIX 习惯 处 理 信号 
的 操作 系统 通常 需要 使 用 这 些 代码 来 区 分 C 信号 和 操作 系统 信号 之 间 的 不 同 
之 处 。 


图 9-2 显示 了 文件 raise.c， 它 定义 了 一 个 不 需要 操作 系统 支持 的 
raise 版 本 。 该 函数 包含 了 一 个 存储 信号 处 理 程 序 地 址 的 数组 _Sigfun， 这 
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函数 signal 


声明 sigtable 


硬件 信号 


个 数组 按照 信号 编码 编排 索引 。 开 始 时 ， 数 组 的 每 一 个 元 素 都 初始 化 为 一 个 
空 指 针 ， 这 恰好 和 SIG DFL 匹配 ， 该 值 被 signal 用 来 表示 默认 处 理 。 


raise 首先 要 确定 信号 编码 是 有 效 的 。 如 果 有 效 ， 函 数 就 按照 Sig- 
table 中 对 应 的 元 素 所 指定 的 方式 进行 处 理 。 默 认 的 处 理 是 向 标准 错误 流 输 
出 一 条 单行 信息 并 以 不 成 功 的 状态 终止 程序 。 它 对 它 所 知道 的 信和 号 进行 命名 
而 对 于 其 他 信号 打印 出 编码 值 。 如 果 想 输出 更 多 的 错误 提示 信息 ， 可 以 为 附 
加 的 信号 添加 名 字 。 


图 9-3 显示 了 文件 signal.c。 它 定义 了 函数 signal, BANE LET 
函数 raise 结合 使 用 。 它 所 做 的 就 是 确认 它 的 参数 有 效 并 且 用 一 个 有 效 的 函 
数 指针 来 代替 _Sigtable 中 的 适当 的 项 。( 如 果 指 针 不 和 SIG ERR 匹配 ， 就 
认为 它 是 有 效 的 ， 但 这 种 检测 非常 不 牢靠 。) 


注意 这 个 文件 中 对 sigtable 的 声明 。 我 通常 的 做 法 是 把 这 样 的 声明 放 
在 一 个 头 文件 中 ， 所 有 要 使 用 它 的 C 源 文件 都 要 包含 这 个 头 文件 。 在 这 种 情 
况 下 这 个 头 文件 可 以 是 <signal.Ph>， 但 是 只 有 当 某 个 屏蔽 宏 引 用 了 它 时 才 可 
以 是 <signal,h>。 所 以 更 可 行 的 是 ， 这 个 头 文件 为 某 个 具有 "xsignal.h" 这 
样 名 字 的 内 部 头 文件 。 然 而 ， 我 不 能 仅仅 为 了 一 个 声明 而 创建 一 个 头 文件 ， 
任何 风格 在 实际 使 用 中 都 有 例外 。 


产生 “硬件 信号 ”时 ， 某 些 系统 指定 的 代码 需要 得 到 控制 权 ， 可 以 把 这 
些 代码 添加 到 signal 中 。 硬 件 信 号 是 操作 系统 或 者 计算 机 本 身 报告 的 信号 ， 
所 以 这 里 一 定 要 小 心 。 很 多 系统 都 会 把 控制 权 转 移 到 指定 的 地 址 ， 但 不 会 遵 
F C 函数 调用 和 返回 的 规则 。 所 以 通过 这 种 方式 处 理 的 每 一 个 信号 都 必须 使 
用 一 些 汇编 代码 。 


告诉 操作 系统 〈 或 者 计算 机 ) 把 控制 权 转 移 给 汇编 语言 信号 处 理 程序 ， 
让 处 理 程序 保存 所 有 有 用 的 上 下 文 环境 ， 并 且 调 用 通过 适当 的 协议 调用 指定 
的 C 函数 。 它 可 以 从 一 个 静态 数据 对 象 中 确定 一 个 地 址 ， 当 然 ， 你 知道 如 何 
用 C 和 汇编 语言 来 访问 这 个 数据 对 象 。 如 果 C 函数 返回 了 ， 汇 编 语 言 信 号 处 
理 程 序 就 会 反 过 来 把 控制 权 转 移 给 中 断 程序 。 


一 些 操作 系统 要 求 要 求 报 告 信 号 处 理 程序 何 时 完成 。 对 于 一 个 可 以 返 
回 的 信号 处 理 程序 ， 这 相对 比较 简单 ， 汇 编 语言 信号 处 理 程序 可 以 在 退出 的 
时 候 做 任何 需要 做 的 事情 。 但 是 不 要 忘 了 ， 信 号 处 理 程序 也 可 以 通过 调用 
<stdlib.h> 中 的 abort 或 者 exit 或 者 通过 调用 «setjmp.h» 中 的 1ongjmp 
来 终止 执行 。 为 了 可 以 正确 处 理 所 有 的 情况 ， 我 们 还 要 适当 地 做 一 些 工作 。 
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图 9-2 


raise.c 


/* raise function -- simple version */ 
finclude <signal.h> 
#include <stdio.h> 
#include <stdlib.h> 


/* static data */ 
-Sigfun * Sigtable[ NSIG] = (0) ; /* handler table 


int (raise) (int sig) 


{ /* raise a signal 
_Sigfun *s; 


if (sig <= 0 || NSIG <= sig) 
return (-1); /* bad signal 
if ((s = _Sigtable[sig]) != SIG IGN && s !- SIG DFL) 
{ /* revert and call handler 
_Sigtable[sig] = SIG DFL; 
(*s) (sig); 
) 
else if (s == SIG DFL) 
{ /* default handling 


char ac[10], *p; 


switch (sig) 


{ /* print known signals by name 
case SIGABRT: 
p = “abort"; 
break; 
case SIGFPE: 
p = "arithmetic error"; 
break; 
case SIGILL: 
p = "invalid executable code"; 
break: 
case SIGINT: 
p = "interruption"; 
break; 
case SIGSEGV: 
p = "invalid storage access"; 
break; 
case SIGTERM: 
p = "termination request"; 
break; 
default: 
*(p = &ac[(sizeof ac) - 1]) = '\0'; 
do *--p = sig $ 10 + '0'; 
while ((sig /- 10) != 0); 
fputs ("signal ën, stderr); 
) 
fputs(p, stderr); 
fputs(" -- terminating\n", stderr); 
exit(EXIT FAILURE); 


) 
return (0); 


) 


*/ 
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图 9-3 /* signal function -- simple version */ 
signal.c #include «signal.h» 


/* external declarations */ 
extern Sigfun * Sigtable[ NSIG]; 


_Sigfun *(signal) (int sig,  Sigfun *fun) 


{ /* specify handling for a signal */ 
_Sigfun *s; 


if (sig <= 0 || _NSIG <= sig || fun == SIG ERR) 
return (SIG_ERR); /* bad signal */ 
/* add machine-dependent handling here */ 
S = Sigtable[sig], _Sigtable[sig] = fun; 
return (s); 
) OG 


9.5 «signal.h» 的 测试 
图 9-4 显示 了 文件 tsignal.c， 它 做 的 工作 很 少 ， 因 为 信号 的 可 移植 的 
属性 太 少 了 。 该 文件 所 做 的 全 部 工作 就 是 用 SIGFPE 测试 signal 和 raise 基 
本 的 工作 情况 。 这 些 代码 假设 程序 执行 的 时 候 没 有 其 他 的 程序 报告 这 个 信号 。 
这 个 假设 是 非常 安全 的 ， 但 是 C 标准 并 没有 这 样 的 保证 。 这 个 测试 程序 也 可 
以 检测 是 不 是 定义 了 各 种 宏 ， 包 括 sig_atomic_t 类 型 。 但 是 ， 它 并 不 去 检 
查 相关 的 语义 。 
因此 ， 程 序 以 字 节 为 单位 显示 了 sig atomic t 的 大 小 。 如 果 一 切 进行 
顺利 的 话 ， 程 序 会 显示 以 下 内 容 : 


sizeof (sig atomic t) = 2 
SUCCESS testing <signal.h> 
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PDP-11/70 Processor Handbook (Maynard, Mass.: Digital Equipment Corpora- 
tion, 1976). PDP-11 的 陷阱 和 中 断 是 UNIX 最 早 定义 信号 的 灵感 之 源 。 它 可 以 
让 我 们 更 好 地 理解 UNIX 信号 的 名 字 和 语义 。 


97 习题 
9.1. 列 内 你 使 用 的 C 翻译 器 定义 的 信号 编码 。 能 用 一 名 话 描述 每 个 信号 表示 的 含 
义 吗 ? 
9.2 ”对 于 你 使 用 的 翻译 器 定义 的 信号 编码 ， 设 计 可 以 引发 每 个 信号 的 测试 程序 。 
9.3 ”在 哪 种 情况 下 你 会 关心 是 否 存 在 没有 报告 的 信号 ? 
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^ E. 


AOF 


<signal.h> 


图 9-4 


tsignal.c 


9.4 


9.5 


9.6 


9.7 


/* test signal functions */ 
#include «assert.h» 
#include «signal.h» 
#include <stdio.h> 

#include <stdlib.h> 


/* static data */ 
static int sigs[] = ( 
SIGABRT, SIGFPE, SIGILL, SIGINT, SIGSEGV, SIGTERM}; 
static void (*rets[]) (int) = (SIG_DFL, SIG_ERR, SIG_IGN}; 
static sig_atomic_t atomic; 


static void field_fpe(int sig) 
{ /* handle SIGFPE */ 
assert (sig == SIGFPE); 
puts ("SUCCESS testing <signal.h>"); 
exit (EXIT_SUCCESS) ; 
} 


main () 
{ /* test basic workings of signal functions */ 
printf("sizeof (sig atomic t) = %u\n", 
sizeof (sig_atomic_t)); 
assert (signal (SIGFPE, &field fpe) == SIG DFL); 
assert (signal(SIGFPE, &field fpe) == &field fpe); 
raise(SIGFPE); 
puts("FAILURE testing «signal.h»"); 
return (EXIT FAILURE); 
) 


修改 signal 和 raise， 使 它们 能 适应 你 的 C 翻译 器 ， 尽 可 能 多 地 处 理 硬件 
信和 号 。 


编写 信号 SIGABRT 的 处 理 程序 ， 使 它 可 以 显示 逆 踪 迹 〈trace back) 一 一 活 
动 函 数 的 列表 ， 这 个 列表 按照 它 它们 的 调用 | 顺序 逆序 显示 。 这 种 功能 有 什么 用 
途 ? 


[ 难 ] RE C 标准 库 中 不 应 该 被 一 个 信号 中 断 的 关键 区 域 。 如 果 这 些 区 域 活动 
的 时 候 有 信号 被 报告 ， 就 推迟 对 该 信号 的 处 理 ， 直 到 关键 区 域 的 活动 结束 。 
这 种 功能 有 什么 用 途 ? 


[很 难 ] 实现 信号 的 新 的 语义 ， 要 保证 以 下 几 点 : 
PD 信号 不 能 被 复制 或 者 丢失 ; 
言 号 按照 报告 的 顺序 进行 处 理 ; 
口 一 个 程序 在 某 个 点 之 后 一 定 可 以 处 理 所 有 报告 的 信号 ; 
O 关键 区 域 可 以 被 保护 不 被 中 断 打扰 
D) 一 个 信号 处 理 程序 可 以 安全 地 跟 程 序 的 其 他 部 分 通信 。 


历史 


<stdarg.h> 


C 语言 有 一 个 强大 的 功能 ， 就 是 它 允 许 定义 可 接受 一 个 可 变 参数 列表 的 
函数 。 当 然 ， 其 他 语言 也 有 这 样 的 函数 ， 但 是 这 种 函数 的 数目 是 固定 的 ， 而 
且 所 有 的 都 是 内 舱 到 语言 中 的 特殊 函数 ， 不 能 自己 定义 额外 的 函数 。 


为 了 访问 一 个 可 变 参数 表 中 额外 的 参数 ， 就 需要 使 用 <stdarg.h> 中 定 
义 的 宏 。 它 们 允许 在 任何 时 候 从 头 到 尾 地 遍历 一 个 附加 参数 列表 。 在 遇 到 每 
一 个 参数 之 前 ， 必 须知 道 它 的 类 型 。 但 是 在 一 个 给 定 的 调用 发 生 之 前 ， 不 必 
知道 它 的 细节 。 可 以 使 用 一 个 固定 的 参数 ， 例 如 一 个 格式 串 ， 来 确定 参数 的 
数目 和 类 型 。 


Sk X fF <stdarg.h> 是 X3J11 委员 会 的 发 明 ， 它 很 大 部 分 都 以 头 文件 
<varargs.h> 为 基础 。 这 个 头 文件 是 Andy Koenig 为 了 增强 UNIX 操作 系统 
的 可 移植 性 而 开发 的 。 当 时 曾 几 次 尝试 摆脱 实现 对 遍历 可 变 参 数 表 的 依赖 ， 
<varargs.h> 就 是 其 中 的 一 个 版 本 ， 也 是 众所周知 的 一 个 。 其 中 的 思想 是 通 
过 把 差别 隐藏 在 宏 里 来 构造 一 个 可 移植 性 更 强 的 公共 操作 。 


在 很 早 的 时 候 ， 这 样 的 隐藏 是 不 必要 的 ， 因 为 当时 C 是 PDP-11 专用 的 
a. + AMAIA Dennis Ritchie 的 编译 器 是 如 何 安 排 内 存 中 的 参数 列表 
的 。 在 指针 算术 中 ， 参 数 的 转移 非常 简单 。 指 针 的 大 小 和 int 类 型 的 大 小 相 
同 ， 并 且 结 构 不 允许 作为 参数 ， 这 一 点 也 很 有 用 。 那 就 是 说 可 以 把 参数 当 作 
int, long 或 者 double 类 型 来 对 待 。 因 为 在 PDP-11 P, double 的 存储 排列 和 
int 的 相同 ， 所 以 为 了 保证 适当 的 存储 对 齐 不 必 担 心 参数 列表 中 留 出 很 多 空 
B. 

结构 参数 和 各 种 大 小 的 指针 的 出 现 带 来 了 混乱 。 即 使 不 想 编 写 可 移植 的 


代码 ， 我 们 仍然 希望 代码 具有 很 强 的 可 读 性 ， 这 就 强烈 地 需要 使 用 一 个 符号 
来 隐藏 忆 历 可 变 参数 表 的 杂乱 的 细节 。 
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头 文件 
<stdarg.h> 


限制 


FF va start 


Æ va arg 


m 
3 
d 


随后 出 现 了 一 些 C 的 实现 ， 它 们 的 设计 目标 是 让 C 语 言 可 以 和 像 
FORTRAN 这 样 的 老 的 程序 设计 语言 一 起 工作 。 对 这 样 的 实现 来 说 ， 有 时 候 
就 需要 一 个 调用 序列 ， 这 个 调用 序列 和 PDP-11 的 区 别 很 大 。 在 内 存 中 ， 参 
数列 表 有 时 候 向 下 延伸 ， 而 不 是 向 上 ， 还 有 某 些 参数 列表 涉及 了 指向 实际 参 
数值 的 中 间 指 针 。 这 时 ， 隐 藏 访问 参数 的 细节 从 便利 性 提升 到 了 必要 性 。 


X3J11 委员 会 感到 有 责任 在 某 些小 方面 修改 存在 的 宏 ， 这 也 是 C 标准 用 
一 个 新 的 名 字 命 名 一 个 标准 头 文件 的 原因 。<stdqarg.h> 和 «varargs.h» 的 
差别 很 大 ， 足 以 给 那些 使 用 旧 的 头 文件 的 程序 (和 程序 员 ) 造成 困惑 。 该 委 
员 会 经 过 很 多 讨论 ， 就 是 为 了 让 <stdarg.h> 的 功能 更 像 是 这 个 语言 的 一 部 
分 。 然 而 ， 最 后 委员 会 通过 投票 把 遍历 可 变 参数 表 的 机 制作 为 宏 保留 了 下 来 。 


X3J11 实际 上 做 的 是 尽 可 能 推广 这 些 宏 。 他 们 的 做 法 是 以 某 种 方式 定义 
QUEE, RIBUS GARI C 的 实现 无 需 大 的 修改 就 可 以 跟 它 们 保持 一 致 。 仍 
有 菜 些 实现 不 得 不 修改 它们 的 翻译 器 来 提供 关键 的 信息 或 者 操作 。 然 而 ， 大 
部 分 实现 都 不 需要 翻译 器 的 帮助 就 可 以 支持 <stdarg.h>. 


«stdarg.h» 中 定义 的 宏 被 强加 了 一 些 限制 。 这 些 限 制 表 面 上 看 起 来 不 
是 很 严重 ， 但 对 某 些 实现 来 说 ， 确 实 很 严重 。 不 过 ， 每 一 个 限制 的 引入 都 是 
为 了 满足 至 少 一 个 严格 的 C 实现 的 需要 ， 例 如 : 


C) 一 个 函数 必须 至 少 声明 一 个 固定 的 参数 。 宏 va start 引用 了 最 后 一 
个 固定 参数 所 以 它 能 够 对 可 变 参数 表 进 行 定位 。 

O 不 能 在 va arg 中 没有 函数 原型 的 情况 下 指定 会 “ 增 宽 ”(〈widen) 的 
参数 类 型 。 例 如 ， 必 须 用 doulbe RAM float。 这 些 宏 不 能 复制 适 
用 于 可 变 参 数 表 的 改变 参数 类 型 的 规则 。 . 

O 在 va_arg 中 ， 只 能 使 用 某 些 参数 类 型 。 这 是 因为 很 多 宏 的 实现 需要 和 牛 
成 一 个 相关 的 指针 类 型 ， 这 个 指针 类 型 只 是 在 原 类 型 后 面 加 上 一 个 *。 
C 语言 中 的 类 型 编写 规则 是 有 名 的 自 闭 型 ， 所 以 对 这 样 简单 的 工作 方 
式 实现 起 来 也 非常 麻烦 。 

O 一 个 函数 在 返回 到 它 的 调用 者 之 前 一 定 要 调用 va_end。 这 是 因为 某 
些 实现 在 函数 返回 之 前 需要 整理 控制 信息 。 


但 是 ， 总 而 言 之 ，<stdarg.h> 中 定义 的 宏 能 够 很 好 地 工作 ， 并 且 它 们 提供 了 
现代 编程 语言 中 仅 有 的 一 个 非常 强大 的 功能 。 
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102 C 标准 的 内 容 


<stdarg.h> 


va list 


va start 


7.8 可 变 参 数 <stdarg.h> 
头 文件 <staarg.h> 声明 了 一 种 类 型 且 定 义 了 3 个 宏 ， 这 样 就 可 以 提前 访问 个 参数 表 ， 
调用 函数 在 被 编译 时 并 不 知道 这 个 参数 表 中 参数 的 数目 和 类 型 。 
调用 的 函数 具有 可 变数 目 和 可 变 类 型 的 参数 。 就 像 6.7.1 中 描述 的 那样 ， 它 的 参数 表 包 
含 一 个 或 者 多 个 参数 。 在 这 种 访问 机 制 中 ， 最 右边 的 参数 起 着 特殊 的 作用 ， 它 由 这 个 描述 中 的 
parmN 指定 。 
声明 的 类 型 是 
va list 
-个 适合 保存 宏 va start. va arg 和 va end 所 需要 的 信息 的 类 型 。 如 果 要 访问 不 
MP 那么 调用 函数 要 声明 -个 va list 类 型 的 数据 对 象 〔 假 设 该 数据 对 象 名 为 ap)。 对 
$$ ap 可 能 做 为 参数 传递 给 另 一 个 函数 。 如 果 那 个 函数 对 参数 ap 调用 了 宏 va_arg， 那 么 ap 在 
调用 函数 中 的 值 是 不 确定 的 ， 而 且 在 其 他 对 ap 的 引用 之 前 会 把 它 传 递 给 宏 va end. 
7.8.1 可 变 参 数 表 访问 宏 
本 条 中 描述 的 宏 va start 和 va_arg 将 被 作为 宏 实 现 ， 而 不 是 实际 的 函数 。 并 没有 指定 
va end 是 个 宏 还 是 一 个 用 外 部 连接 声明 的 标识 符 。 如 果 掩盖 “个 宏 定义 来 访问 实际 的 函数 
或 者 程序 定义 了 一 个 名 为 va end 的 外 部 标识 符 ， 那 么 这 种 行为 未 定义 。 如 果 要 访问 可 变 参数 ， 
ADAH va start 和 va end 会 在 接受 可 变数 目的 参数 的 函数 中 被 调用 。 
7.8.1.1 宏 va start 
概述 


#include «stdarg.h» 
void va-start (va-list ap, parmN); 


说 明 

要 在 访问 所 有 未 命名 的 参数 之 前 调用 宏 va_start。 

Ziva start 对 ap 进行 初始 化 ， 以 便 后 面 va arg 和 va end 对 它 的 使 用 。 

参数 parmN 是 函数 定义 〈 在 …… 之 前 的 那个 ) 的 可 变 参 数 表 中 最 右边 参数 的 标识 符 。 如 
果 用 register 存储 类 别 ， 一 个 函数 或 者 数组 类 型 ， 或 者 和 应 用 默认 的 参数 提升 产生 的 类 型 不 
兼容 的 类 型 来 声明 参数 parmN， 那 么 这 种 行为 末 定 义 。 

返回 值 

宏 va start 没有 返回 值 。 
7.8.1.2 £ va arg 

概述 


#include <stdarg.h> 
type va-arg(va-list ap, type); 


说 明 

V va arg 展开 为 一 个 表达 式 ， 这 个 表达 式 的 类 型 和 值 跟 调 用 的 下 一 个 参数 的 相同 。 
参数 ap 应 该 和 va start 初始 化 的 va list ap 相同 。va_arg 的 每 一 次 调用 都 会 修改 
ap， 这 样 后 继 参 数 的 值 就 会 依次 返回 。 参 数 类 型 是 指定 的 类 型 名 字 ， 使 得 指向 指定 类 型 的 
数据 对 象 的 指针 的 类 型 可 以 简单 地 通过 在 类 型 后 面 加 一 个 后 缀 * 来 获得 。 如 果实 际 不 存在 
下 一 个 参数 ， 或 者 类 型 和 实际 存在 的 下 一 个 参数 根据 默认 的 参数 提升 规则 来 提升 ) 的 类 
型 不 兼容 ， 那 么 这 种 行为 未 定义 。 

返回 值 

第 一 -次 调用 va start 之 后 ， 对 Va_arg 的 第 一 次 调用 返回 的 是 parmN 指定 的 参数 后 面 
的 参数 值 。 后 面 的 调用 依次 返回 剩 下 的 参数 值 。 
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va end | 7.8.1.3 Zi va end 


#include <stdarg.h> 
void va end(va list ap); 
说 明 


Ži va end 促进 函数 的 正常 返回 ， 该 函数 的 可 变 参数 表 被 初始 化 了 va_list ap 的 
va start MU Olm, va end 可 能 会 对 ap 进行 修改 ， 这 样 它 就 不 再 有 用 (中间 不 
能 再 一 次 执行 va_start )。 如 果 没 有 执行 相应 的 宏 va_start， 或 者 在 返回 之 前 没有 调用 
va_end， 邢 么 这 种 行为 未 定义 。 

返回 值 

宏 va end 没有 返回 值 。 

例子 

函数 f1 把 -个 参数 表 〔 参 数 个 数 不 大 于 MAXARGS〉 放 到 一 个 数组 中 ， 其 中 这 些 参数 
是 指 问 串 的 指针 。 然 后 把 数组 作为 “个 参数 传递 给 消 数 f2。 指 针 的 个 数 由 两 数 £1 的 第 - 
个 参数 指定 。 

#include <stdarg.h> 


#define MAXARGS 31 


void fl(int n ptrs, ...) 

{ 
va_list ap; 
char *array[MAXARGS]; 
int ptr no = 0; 


if (n Ptrs» MAXARGS) 
n Ptrs - MAXARGS; 
va start(ap, n Ptrs); 
while (ptr no « n ptrs) 
arrayíptr no++] = va arg(ap, char *); 
va end(ap); 
f2(n-ptrs, array); 
I 


对 £1 的 每 “次 调用 都 要 有 可 见 的 函数 定义 或 者 类 似 下 面 的 声明 : 


void f1 (int, ...); 


10.3 «stdarg.h» 的 使 用 
使 用 «stdarg.h» 中 声明 的 宏 遍 历 一 个 可 变 参 数 表 。 这 些 宏一 定 要 能 满 
足 各 种 实现 的 和 需求， 因此， 它们 有 以 下 的 限制 。 

D 必须 明确 地 声明 一 个 函数 具有 - -个 可 变 参 数 表 。( 拒 它 叫 做 ELO at 
意味 着 它 的 参数 表 一 定 以 省 略 号 G..) 结尾 ， 在 它 的 定义 和 声明 中 
都 是 如 此 。 而 且 ， 对 这 个 函数 的 所 有 调用 都 应 该 在 用 这 种 方式 声明 函 
数 的 水 数 原型 的 范围 内 。 

D 声明 函数 时 必须 至 少 有 一 个 国定 的 参数 ， 最 后 一 个 固定 参数 引用 时 习 
th LARA parmN。 

C) 必须 声明 一 个 va list 类 型 的 数据 对 象 ， 习 惯 上 称 为 ap。 当然， 这 
个 数据 对 象 在 函数 内 一 定 是 可 见 的 。 

O 必须 在 £ 内 执行 va_start (ap，parmN) ， 在 此 之 后 才能 执行 va_list 
或 者 Va_end。 
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口 然后 可 以 在 函数 中 或 者 它 调用 的 任意 函数 中 执行 va_arg (ap, T). 当 
然 ， 必须 为 每 一 个 参数 按照 它们 在 函数 调用 中 出 现 的 顺序 指定 适当 的 
类 型 。 注 意 ，va_arg 是 一 个 右 值 宏 。 不 能 把 这 个 宏 调 用 作为 一 个 左 
值 来 修改 存储 在 参数 数据 对 象 中 的 值 。 

O 不 能 编写 类 型 m 使 得 当 它 作为 一 个 参数 传递 时 范围 会 变 大 。 用 
double 来 代替 float, FÅ int R Å unsigned int 来 代替 char. signed 
char, unsigned char, short 和 unsigned short. XI TAU int 的 大 小 相同 
的 unsigned short, Hj unsigned int 代替 ; 对 于 表示 为 非 负 值 ， 和 int 
大 小 相同 的 字符 类 型 ， 用 unsigned int 4&8. 

C) 可 以 编写 类 型 7， 它 仅仅 通过 在 后 面 加 一 个 * 就 可 以 转换 为 指针 
类 型 。 例 如 ， 类 型 说 明 符 int 和 char* 是 有 效 的 ,类 型 说 明 符 
char (*) [5] 是 无 效 的 。 作 为 一 般 的 规则 ， 要 注意 那些 包含 圆 括号 或 
者 方 括号 的 类 型 说 明 符 。 

O 如 果 前 面 执行 了 va_start， 那 么 必须 在 于 内 执行 va_enG。 一 旦 执 
行 了 va_end， 就 不 能 再 执行 va_arg 了 ， 除 非 首先 执行 va start 
以 启动 一 次 重 扫描 。 在 这 种 情况 下 ， 必 须 在 函数 返回 前 再 执行 一 次 
va end, 

如 果 所 有 的 这 些 听 起 来 太 消 极 了 ， 那 么 可 以 考虑 一 个 积极 的 例子 。 这 里 

有 一 个 对 <stdio.h> 中 声明 的 函数 fputs 推广 后 的 函数 。 这 个 函数 把 一 个 以 
空 字符 结束 的 字符 串 写 到 指定 的 输出 流 中 ， 如 : 


fputs("this is a test", stdout); 

而 这 个 叫做 va. fputs 的 函数 ， 可 以 把 任意 数目 的 串 写 到 指定 的 流 中 ， 如 ; 
va fpute(stdout, "this is", "a test", NULL); 

在 这 个 例子 中 ， 这 两 个 函数 向 stdout 流 写 入 相同 的 输出 。 
可 以 这 样 编写 va tputs: 


#include «stdarg.h» 
#include «stdout.h» 


int va fputs(FILE *str, ...) 
( /* write zero or more strings */ 
char *s; 
int status - 0; 
va, list ap; 


va start(ap, str); 
while ((s = va arg(ap, char *)) !- NULL) 
if (fputs(s, str) « 0) 
Status - EOF; 
và, end(ap) ; 
return (status); 


) 
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va_list 参数 


可 以 按照 这 种 样式 来 处 理 一 系列 的 可 变 参 数 表 ， 甚 至 可 以 在 一 个 独立 的 
嚼 数 中 处 理 可 变 参 数 表 。 当 然 ， 在 调用 函数 之 前 要 保证 执行 了 va start. JA 
后 ， 在 函数 返回 的 时 候 执行 va_end。 


如 果 想 重新 扫描 可 变 参数 表 ， 那 么 必须 要 更 加 小 心 。 当 然 ， 首 先 要 执 
行 va_start 来 启动 每 一 次 重 扫描 。 在 函数 返回 之 前 ， 并 且 至 少 执行 了 一 次 
va start 之 后 执行 va_ena。 推 荐 一 种 更 加 安全 的 方式 一 一 在 同一 个 循环 内 
BT va start 和 va_ena。 这 样 ， 就 更 能 保证 在 应 该 执行 va ond 的 时 候 执 
行 它 。 

很 多 实现 不 需要 va_end， 这 个 宏 就 展开 什么 都 不 做 的 代码 。 这 就 意味 着 
使 用 这 个 宏 的 过 程 中 出 现 的 所 有 错误 都 会 变 成 一 个 定时 炸弹 ， 不 知道 什么 时 
候 会 出 错 。 而 且 每 过 一 年 ， 寻 找 和 改正 它们 的 花费 就 变 得 更 大 。 所 以 ， 最 好 
预先 尽力 消除 这 些 错误 。 


另 一 个 危险 隐藏 在 调用 一 个 具有 ap (va list 类 型 的 数据 对 象 ) 参数 
的 函数 中 。 在 某 些 实现 中 ， 它 可 能 是 数组 类 型 ， 这 就 说 明 函 数 参 数 实 际 上 
变 成 了 一 个 指向 va list 数组 首 元 素 的 指针 。 当 被 调用 的 函数 执行 va_arg 
时 ， 这 个 数据 对 象 在 调用 函数 ‘上面 称 为 £〉 中 改变 了 。 在 其 他 的 实现 中 ， 
va list 不 是 数组 类 型 ， 也 就 是 说 参数 ap 就 像 它 外 表 那 样 通过 值 传递 。 当 被 
调用 的 函数 执行 va_arg 时 ， 调 用 函数 £ 中 的 这 个 数据 对 象 不 会 改变 。 


如 果 处 理 了 被 调用 函数 中 的 所 有 参数 ， 这 些 区 别 就 不 重要 了 。 然 而 ， 如 
果 在 具有 “相同 ”ap 的 不 同 的 函数 调用 中 执行 va_arg， 情 况 就 不 同 了 。 实 
际 上 ， 如 果 代 码 要 求 va list 数据 对 象 共享 或 者 不 共享 ， 那 么 就 会 出 现 问 
题 。 


可 以 保证 以 下 需要 的 行为 : 


O WẸ va list 数据 对 象 一 定 要 共享 ， 那 么 把 参数 写 为 tap， 把 相应 的 
参数 声明 名 va list *pap。 在 函数 内 ， 执 行 va arg(*pap, T) KV 
问 可 变 参 数 表 中 的 每 一 个 参数 。 

口 如 果 va list 数据 对 象 不 能 被 共享 ， 那 么 把 参数 写 为 ap， 把 相应 的 
参数 声明 为 va_list xap。 在 畏 数 内 ， 声 明 一 个 va list ap 的 数据 
对 象 并 执行 memcpy (ap, xap, sizeof(va list)), (memcpy 在 
<string.h> 中 声明 )。 执 行 va_arg(ap， T) 来 访问 可 变 参数 表 中 的 
每 一 个 参数 。 


无 论 va list 定义 为 什么 类 型 ， 这 两 种 方法 都 可 行 。 
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10.4 <stdarg.h> 的 实现 
图 10-1 显示 了 文件 staarg.h， 它 是 实现 «stdarg.h» 所 需 的 唯一 代码 。 
这 里 假定 它 可 以 在 一 个 具体 的 标准 C 实现 下 工作 。 
假设 这 种 方法 假设 如 下 : 
口 一 个 可 变 参 数 表 在 内 存 中 占据 了 一 个 连续 的 字符 数组 。 
后 继 的 参数 占据 着 字符 数组 更 高 位 的 后 继 元 素 。 
一 个 参数 占据 的 空间 开始 于 2" 字 节 的 整数 倍 的 存储 边界 。 
存储 空间 的 大 小 是 可 以 表示 这 个 参数 的 2 字 节 的 最 小 倍数 。 
存储 空间 中 留 下 的 任何 “ 空 除 ” 总 是 在 参数 数据 对 象 的 开头 或 者 结 
尾 。 
这 些 假设 在 很 多 标准 C 实现 上 都 成 工 。 
头 文 件 和 往常 一 样 ， 内 部 头 文件 <yvals.p> 定义 了 描述 不 同系 统 之 间 的 变化 的 
<yvals.h> 宏 。 对 头 文件 «stdarg.h» 来 说 ， 有 两 个 相关 的 参数 : l 
% _AUPBND f) _AUPBND 是 一 个 在 可 变 参 数 表 内 部 确定 存储 边界 的 屏蔽 宏 ， 它 的 值 为 
2-1. 
32  ADNBND O — ADNBND 是 一 个 确定 存储 空隙 是 否 在 一 个 参数 数据 对 象 的 开端 或 者 结 
尾 的 屏 项 宏 。 如 果 空 隙 在 尾 处 ， 它 的 值 为 2-1; 否则 为 0。 
Borland Turbo C++ 编译 器 就 是 一 个 简单 的 例子 。 对 于 该 实现 ， 头 文件 
«yvals.h» 包含 了 下 面 的 定义 : 


#define -AUPBND 1 
#define -ADNBND | 


DOD DO 


图 10-1 /* stdarg.h standard header */ 
stdarg.h |#ifndef _STDARG 
#define  STDARG 
#ifndef | YVALS 
#include <yvals.h> 
#endif 
/* type definitions */ 
typedef char *va list; 
/* macros */ 
#define va arg(ap, T) ^ 


(*(T *)(((ap) += Bnd(T, . AUPBND)) - _Bnd(T, _ADNBND) )) 
#define va end(ap) (void)O 
#define va start(ap, A)\ 

(void) (tap) = (char *)&(A) + _Bnd(A, , AUPBND)) 


#define Bnd(X, bnd) (sizeof (X) + (bnd) & ~ (bnd) ) 
fendif D 
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10.5 


我 发 现在 Sun UNIX 工作 站 下 的 GNU C 编译 器 中 ， 有 必要 在 一 个 参数 之 
前 指定 一 个 存储 空隙 。 对 这 个 系统 而 言 ，_AUPBND 的 值 为 3， 但 是 _ADNBND 
的 值 为 0。 


现在 我 们 就 能 理解 stdarg.h 中 涉及 的 技巧 了 。va_list 类 型 只 是 一 个 
指向 char 的 指针 ， 这 样 的 数据 对 象 保存 一 个 指向 下 一 个 参数 空间 的 起 始 位 置 
的 指针 。 


宏 va start 跳 过 已 命名 的 参数 ， 也 就 是 最 后 一 个 固定 参数 。 它 使 用 内 
部 宏 _Bnd 来 把 它 的 参数 大 小 近似 为 2* 字 节 的 一 个 倍数 。 


宏 ve arg 是 这 些 宏 中 技巧 性 最 强 的 一 个 。 该 宏 首先 通过 增加 va list 
数据 对 象 的 内 容 来 使 它 指向 下 一 个 参数 空间 的 起 始 位 置 ， 然 后 再 退回 来 指向 
当前 参数 的 起 始 位 置 ， 然 后 通过 强制 类 型 转换 把 这 个 指针 值 转换 为 指定 类 型 
的 指针 ， 最 后 解 引用 这 个 指针 以 访问 存储 在 数据 对 象 中 的 值 。( 在 这 个 实现 
中 ，va_arg 是 一 个 左 值 ， 不 要 指望 其 他 的 实现 中 也 是 这 样 。) 


va_end F va end 在 这 个 实现 中 什么 部 不 做 ， 它 展开 为 一 个 占 位 符 表 达 式 
(void) 0, 
<stdarg.h> 的 测试 


图 10-2 显示 了 文件 tstqarg.c， 它 测试 <stdarg.h> 中 定义 的 宏 。 函 数 
tryit 接受 - -个 具有 各 种 参数 类 型 的 可 变 参 数 表 。 一 个 格式 串 参数 会 告诉 这 
个 函数 想 要 的 东西 ， 和 <stdio.h> 中 声明 的 打印 和 扫描 通 数 差不多 。 

我 发 现 不 止 一 个 实现 不 能 正确 地 处 理 cstruct 类 型 的 数据 对 象 。 它 是 包 
含 一 个 单字 符 的 结构 。 并 不 是 每 个 人 都 能 记 住 一 个 参数 会 那样 小 。 

因此 ， 这 个 程序 显示 了 va list 类 型 的 数据 对 象 的 大 小 《以 字 节 为 音 
RO. MRE- 切 顺 利 的 话 ， 测 试 程序 会 输出 类 似 于 下 面 的 东西 : 


sizeof (va list) = 4 
SUCCESS testing <stdarg.h> 
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UNIX Programmer's Reference Manual,4.3 Berkeley Software Distribution 
Virtual VAX-11 Version (Berkeley, Ca.: University of California, 1986). 这 里 讨论 的 
是 头 文件 <stdarg.h> 的 原型 «varargs.h» 的 起 源 。 


图 10-2 
tstdarg.c 


/* test stdarg macros */ 
#include «assert.h» 
#include «stdarg.h» 
#include <stdio.h> 


/* type definitions */ 


typedef struct { 
char c; 
) Cstruct; 


static int tryit(const char *fmt, ...) 


{ 
int ctr = 0; 
va list ap; 


/* test variable argument list */ 


va start(ap, fmt); 
for (; *fmt; ++fmt) 
switch (*fmt) 
{ /* switch on argument type */ 
case 'i': 
assert(va arg(ap, int) == ++ctr); 
break; 
case 'd': 
assert(va arg(ap, double) == ++ctr); 
break; 
case 'p': 
assertí(va arg(ap, char *) [0] == ++ctr); 
break; 
case 's': 
assert (va arg(ap, Cstruct).c == ++ctr); 
) 
va end(ap); 
return (ctr); 
) 
int main() 
{ /* test basic workings of stdarg macros */ 
Cstruct x = (3); 
assert (tryit("iisdi", "Mi", 2, x, 4.0, 5) == 5); 
assert (tryit("") == 0); 
assert (tryit("pdp", "NL", 2.0, "\3") == 3); 
printf("sizeof (va_list) = %uln", sizeof (va_list)); 


puts ("SUCCESS testing <stdarg.h>"); 
return 


} 


(0); 
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通过 阅读 文档 确定 你 的 C 翻译 器 是 怎样 在 一 个 可 变 参数 表 中 存储 参数 的 ? x 
档 告 诉 你 的 知识 足够 多 吗 ? 

通过 阅读 你 的 C 翻译 器 提供 的 头 文件 <stdarg.h>， 确 定 该 翻译 器 是 怎样 在 
一 个 可 变 参 数 表 中 存储 参数 的 ? 这 个 文件 告诉 你 的 足够 吗 ? 

通过 检查 测试 程序 tstdarg.c (K 10-2) 生成 的 代码 来 确定 你 的 C 翻译 器 是 
怎样 在 一 个 可 变 参数 表 中 存储 参数 的 ? 那些 知识 足够 吗 ? 如 果 不 够 ， 向 程序 
中 添加 点 东西 来 提供 这 些 缺 失 的 信息 。 

修改 本 章 中 出 现 的 代码 ， 使 头 文 件 <stdarg.h> 可 以 在 你 使 用 的 C 翻译 器 下 
工作 。 


编写 函数 char *scat (char *dest, const char *src, . . . )。 这 个 函 
数 可 以 把 一 个 或 者 多 个 字符 串 拼接 起 来 并 把 它们 写 入 dest 中 。 第 一 个 字符 
串 的 起 始 位 置 是 src， 一 个 空 指针 结束 这 个 列表 。 涵 数 返回 一 个 指针 ， 指 向 
那个 起 始 位 置 在 dest 的 字符 串 中 表示 结束 的 空 字符 。 

[ 难 ] 假设 你 想 测 试 一 个 参数 是 否 在 一 个 可 变 参 数 表 中 。 如 果 在 ， 你 想 知 道 它 
的 类 型 。 描 述 一 个 可 以 让 你 实现 这 种 功能 的 符号 。 


1 很 难 ] 实现 你 在 上 题 中 描述 的 符号 。 


独立 与 宿主 


«stddef.h» 


X Xd <stddef .h> 是 X3J11 委员 会 在 制定 C 标准 过 程 中 的 又 一 发 明 。 
这 个 名 字 遵 循 了 C 标准 库 对 头 文件 命名 的 隐 临 模式 。 它 暗含 的 意思 就 是 “ 标 
准 定义 ”。 


这 个 头 文件 中 的 定义 也 可 以 放 在 另 一 个 头 文件 <stalib.h>。 后 者 也 是 
该 委员 会 的 发 明 。 它 也 用 自己 含糊 的 名 字 说 明了 它 是 声明 各 种 函数 的 地 方 ， 
不 管 是 旧 的 还 是 新 的 ， 只 要 和 其 他 标准 头 文件 没有 直接 联系 ， 都 可 以 放 在 这 
个 头 文件 中 。 创 造 这 样 两 个 包罗 万 象 的 存储 室 可 能 看 上 去 很 思春 ， 不 过 ， 委 
员 会 有 它 的 理由 。 


X3J11 委员 会 的 某 些 成 员 坚 持 认为 ， 即 使 在 一 个 独立 环境 中 ，C 语言 也 
应 该 有 它 的 用 途 。 独 立 的 环境 是 一 个 由 于 种 种 原因 而 不 能 支持 完整 的 C 标准 
库 的 环境 。C 标准 需要 一 个 独立 的 实现 来 支持 这 个 语言 本 身 的 所 有 特性 。 然 
而 ， 对 于 C 标准 库 来 说 ， 这 样 的 实现 只 要 提供 4 个 标准 头 文件 定义 的 功能 就 
可 以 了 <float.h>, <limits.h>, <stdarg.h> 和 <stddef.h>。 它 也 可 
以 支持 更 多 ， 但 是 C 标准 没有 对 中 间 级 别 进行 说 明 。 


在 一 些 环境 中 ， 实 现 必须 提供 整个 的 C 标准 库 ， 这 种 环境 就 称 为 宿主 环 
境 ， 它 是 用 来 指 代 完 全 实现 C 标准 的 环境 的 正式 术语 。 当 然 ， 这 本 书 主要 关 
心 的 是 描述 这 样 的 宿主 环境 。 假 设 任意 的 独立 环境 想 要 严格 遵循 C 标准 ， 它 
只 需要 提供 所 需 的 4 个 标准 头 文件 。 

这 个 要 求 说 清楚 了 <stddef .h> 中 应 该 包括 的 东西 ， 因 为 其 他 3 个 标准 
头 文件 只 适用 于 某 些 特 定 的 领域 : 

O «float.h» 描述 了 浮 点 数 表示 的 属性 ; 

O «limits.h» 描述 了 整数 表示 的 属性 ; 

口 «stdarg.h» 提供 了 遍历 可 变 参数 表 时 需要 的 宏 。 


_ 独立 环境 程序 使 用 的 所 有 其 他 类 型 或 者 宏 定义 都 只 能 由 一 个 头 文件 提 
Hit, Bl <stddef.h>, 
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同 义 类 型 


à 


X offsetof 


委员 会 后 来 的 一 个 决定 使 这 些 头 文件 变 得 有 点 乱 ， 因 为 有 几 个 类 型 和 宏 
被 多 个 头 文件 定义 了 。 例 如 ， 头 文件 <locale.h> jE XT 7E NULL, fi <std- 
def be 和 其 他 四 个 标准 头 文件 也 定义 了 。 相 似 地 ，size t 和 wchar_t 类 型 
在 «stddef .h> 和 其 他 的 标准 头 文件 中 都 有 定义 。 如 果 一 个 头 文件 总 是 从 其 
他 的 地 方 复 制 有 用 信息 ， 那 就 削弱 了 这 个 头 文件 对 定义 的 作用 。 不 过 ， 其 他 
标准 头 文件 在 独立 环境 中 可 能 无 效 。 


«stddef.h» 中 定义 的 类 型 和 宏 另 外 还 有 一 个 共同 点 ， 就 是 它们 每 一 个 
都 可 能 在 某 个 时 候 加 到 语言 本 身 中 ， 因 为 它们 最 后 可 以 被 翻译 器 以 特有 的 方 
式 来 定义 。 编 写 可 代替 这 些 定义 的 可 移植 代码 并 不 是 很 容易 ， 甚 至 有 时 候 根 
本 不 可 能 。 


另 一 方面 ， 作 为 一 个 规则 ，<stdqef.h> 中 定义 的 所 有 的 类 型 和 宏 都 可 
以 作为 常规 的 类 型 和 宏 的 定义 来 编写 。 实 现 者 只 需要 关心 一 个 具体 的 翻译 器 
怎样 定义 某 些 类 型 和 操作 就 可 以 了 。 l 


考虑 一 下 这 个 头 文 件 中 的 3 个 类 型 定义 一 一 ptrdiff t. size_t 和 
wchar_t， 每 一 个 都 和 一 个 标准 整 型 同 义 。 例 如 ， 一 个 实现 不 能 定义 short 为 
16 fj, wchar t 为 24 位， 而 int 为 32 位 。 它 必须 让 wchar_t 和 指定 一 个 类 
型 定义 的 某 个 类 型 相同 ， 另 外 两 个 类 型 定义 也 是 如 此 。 


实现 宏 NULL 仅仅 需要 从 以 下 的 几 个 选项 中 选 出 最 合适 的 一 一 0、05 或 
者 voidaQ(*)0。 选 择 一 种 形式 ， 使 得 它 可 以 在 没有 函数 原型 的 情况 下 作为 一 个 
指向 void 类 型 的 指针 (或 者 指向 char. signed char 或 unsigned char 类 型 的 指 
针 ) 类 型 的 参数 正确 工作 。(11.3 节 中 会 更 加 详细 地 讨论 宏 NOLL.) 


在 C 语 言 中 包含 一 个 空 指针 常量 可 能 会 更 好 。 这 个 建议 被 提出 过 无 数 
次 。 然 而 ， 其 中 的 一 种 形式 已 经 可 以 满足 NULL 可 能 被 使 用 的 情况 了 。 


还 有 一 个 宏 是 offsetof。 可 以 使 用 这 个 宏 确定 一 个 结构 成 员 和 这 个 结构 
的 起 始 位 置 的 偏 移 量 〈 以 字 节 为 单位 )。 标 准 C 没有 定义 编写 这 个 宏 的 可 移 
植 方式 ， 然 而 ， 每 一 个 实现 肯定 会 有 定义 它 的 某 个 非 标准 形式 。 例 如 ， 一 个 
实现 可 能 会 可 靠 地 计算 某 些 表 示 式 的 值 ， 而 这 些 表达 式 的 行为 却 不 在 C 标准 
的 定义 之 列 。 


可 以 把 offsetof 看 作 执行 一 个 不 可 移植 操作 的 可 移植 方式 ， 这 对 CO 
准 库 中 的 很 多 宏和 类 型 定义 来 说 都 是 成 立 的 。 实 际 上 适当 扩展 C 语言 本 身 的 
需求 并 不 只 是 在 这 几 个 实例 中 ， 这 就 是 头 文件 «stadet.n» 存在 的 原因 。 
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11.2 C 标准 的 内 容 


7.1.6 一 般 定义 «stddef.h» 


«stddef.h» 以 下 的 类 型 和 宏 由 标准 头 文件 «stadef.n» 定义 ， 某 些 也 有 在 其 他 的 头 文件 中 定义 ， 
在 它们 相应 的 条 款 中 都 有 说 明 。 
JUR UM FILA: 


ptrdiff t ptrdiff t 
| 是 其 个 指针 相 减 的 结果 的 有 符号 整数 类 型 。 


wchar t 
i 是 PR, EAM ÆR BAS REE PT RR A Se, Mi 
该 字符 集 是 由 文 持 它 的 区 域 设 置 指定 的 。 空 字符 的 编码 值 应 该 为 零 。5.2.1 中 定义 的 基本 字符 
集 的 每 - -个 成 员 的 编码 值 都 应 该 和 它 在 一 个 整数 字符 常量 中 作为 单独 字符 使 用 时 的 值 相等 - 
HAM FILT: 


| 
size t size 七 
是 sizeof 操作 符 的 结果 的 无 符号 整数 类 型 。 
wchar t 
| 


NULL 
NULL 展开 为 实现 定义 的 空 指针 常量 ; 


offsetof (type, member-designator) 
展开 为 一 个 size t JO METER hoec. BANER A ME AE OH rype 
offsetof | 指定 ) 到 结构 成 员 Cr member-designator 指定 ) Ww E, TTA R. member- 
designator 应 该 满足: 
static type ti 
然后 表达 式 & (t. member-designator) 就 会 计算 一 -个 地 址 常 其 。( 如 果 指 定 的 成 员 是 - 
Phish, WAT A ARE M.D 
参见 : KERE (7.4). 
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对 «stddef.h» 中 的 类 型 定义 和 宏 定义 的 使 用 本 质 上 没有 什么 联系 。 赴 
要 使 用 该 头 文件 提供 的 一 个 或 者 更 多 的 定义 ， 就 包含 该 头 文件 。 然 而 ， 只 有 
ptrdiff 上 类 型 定义 和 offsetof 宏 定 义 是 这 个 头 文件 特有 的 ， 通 常 包含 另 
一 个 标准 头 文件 就 会 提供 需要 的 定义 。 下 面 就 分 别 每 一 个 类 型 和 宏 的 定义 。 
类 型 ptrdiff t 在 一 个 C 表达 式 中 对 两 个 指针 相 减 时 ， 结 果 的 类 型 就 是 ptraifft t. È 
是 一 个 可 以 表示 负 值 的 整数 类 型 ， 因 此 几乎 可 以 确定 它 是 int 或 者 long 类 型 。 
该 类 型 通常 是 一 个 有 符号 类 型 ， 和 下 面 撒 述 的 无 符号 类 卉 size t 的 位 数 相 
同 。( 上面 我 说 过 这 些 定义 的 使 用 本 质 上 是 没有 联系 的 ， 而 这 两 个 定义 本 身 
是 紧密 联系 在 一 起 的 。) 
只 有 当 两 个 指针 具有 可 兼容 的 数据 对 象 类 型 时 ， 才 能 对 它们 进行 相 减 。 
例如 ， 其 中 一 个 有 const 类 型 限定 符 ， 而 男 一 个 没有 ， 但 它们 指向 相同 的 数 
据 对 象 类 型 。 翻 译 回 可 能 会 检查 类 型 ， 如 果 不 兼 容 就 会 发 出 警告 。 通 常 它 不 
能 确定 是 否 有 这 个 附加 的 限制 一 一 这 两 个 指针 必须 指向 同一 个 数组 数据 对 象 
的 元 素 。 编 写 不 满足 这 个 限制 条 件 的 表达 式 ， 通 常会 从 这 个 减法 中 得 到 一 个 
没有 任何 意义 的 结果 。 
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它 的 计算 方法 实际 上 是 按照 下 面 的 步骤 进行 的 。 程 序 把 这 两 个 指针 都 表 
示 为 对 公共 地 址 空间 中 的 某 一 个 点 的 偏 移 量 〈 以 字 节 为 单位 ); 然后 把 这 两 
个 偏 移 量 相 减 ， 得 到 一 个 有 符号 的 中 间 结 果 ， 接着 让 该 中 间 结 果 除 以 这 两 个 
指针 指向 的 数据 对 象 的 大 小 (以 字 节 为 单位 )。 如 果 这 两 个 指针 指向 同一 个 
数组 的 元 素 ， 那 么 这 个 除法 就 不 会 产生 余数 。 不 论 这 些 元 素 是 什么 类 型 ， 最 
后 的 结果 都 是 这 两 个 数组 元 素 的 下 标 之 差 。 


这 就 是 说 ， 例 如 ， 表 达 式 &a[5]-&a[2] 的 值 总 是 3， 类 型 为 ptrdiff t, 
ANU, &al2]-sal5) 的 值 总 是 -3。 这 两 种 情况 中 都 假设 a 是 一 个 至 少 有 5 
个 元 素 的 数组 数据 对 象 。( 如 果 a 恰 好 含有 5 个 元 素 ， 对 于 sa[5] 这 种 情况 ， 
指针 算术 就 是 为 一 个 数组 “末尾 之 后 ”的 元 素 定义 的 。) 


在 一 些 实例 中 ，ptrqiff_t 可 能 不 是 很 完备 。 假如 在 一 个 实现 中 ， 
size t 是 unsigned int 类型， 那么 ptrdiff t 就 是 int 类 型 。 然 后 我 们 声明 
一 个 char 类 型 的 数组 数据 对 象 x， 它 的 大 小 N 大 于 INT MAX 字 节 。( 头 文件 
«limits.h» 把 宏 INT MAX XO int 类 型 可 以 表示 的 最 大 的 正 值 。 〉 然后 编 
写 类 似 于 下 面 的 代码 : 


#include «limits.h» 
#include «stddef.h» 


#define N | INT MAX+10 


char x[N]; 
ptrdiff t n = &x[N] - &x[0]; 
那个 对 n 进行 初始 化 的 表达 式 的 结果 是 什么 ? 因为 结果 太 大 而 不 能 表示 
一 个 ptrdiff t 类 型 的 整数 ， 所 以 会 发 生 溢出 ， 结 果 是 未 定义 的 。 这 个 问题 
是 不 可 避免 的 ， 它 是 标准 C 语言 所 固有 的 缺点 。 


虽然 存在 这 样 的 不 足 ， 但 这 样 的 情况 很 少 发 生 。 它 只 可 能 发 生 在 数 
组 元 素 只 占 一 个 字 节 的 数组 身上 ， 而 且 这 些 元 素 是 char、signed char 或 者 
unsigned char 类 型 ， 其 他 类 型 时 很 少 发 生 。 它 可 能 发 生 在 那些 inc 类 型 是 16 
位 表示 的 计算 机 体系 结构 下 ， 也 可 能 发 生 在 那些 允许 创建 庞大 的 数据 对 象 的 
计算 机 体系 结构 下 。 


即使 那样 ， 也 只 有 当 指 向 两 个 相距 了 半 个 以 上 地 址 空间 的 字符 数组 元 素 
的 指针 相 减 的 时 候 才 会 发 生 溢 出。 而 且 就 算 发 生 了 溢出 ， 可 能 也 不 会 造成 什 
么 问题 ， 因 为 2 的 补 码 算术 《现在 最 常用 的 形式 ) 也 可 以 纠正 很 多 错误 。 程 
序 可 能 会 顺利 地 通过 这 些 危险 ， 并 且 按 照 你 的 意愿 去 执行 。 


我 叙述 所 有 的 这 些 秘密 是 为 了 证 明 一 个 简单 的 结论 : 我 们 很 少 需要 使 用 
ptrdiff t 类 型 定义 。 存 储 指针 减法 的 结果 或 者 两 个 下 标的 差 只 是 我 可 以 想 
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类 型 size 七 


类 型 wchar t 


到 的 实际 应 用 。 通 常 ， 程 序 只 会 在 训练 时 用 到 这 样 的 结果 。 这 种 类 型 本 身 的 
不 足 决定 了 它 不 可 能 获得 所 有 的 指针 减法 的 结果 ， 这 样 就 限制 了 它 在 可 移植 
程序 中 的 使 用 。 知 道 可 以 确定 一 个 指针 减法 的 结果 的 类 型 就 行 了 ， 并 不 用 经 
常 关注 它 。 

在 一 个 C 表 达 式 中 使 用 sizeof 运算 符 的 时 候 ， 结 果 的 类 型 就 是 
size_t。 它 是 一 个 无 符号 整数 类 型 ， 可 以 表示 能 声明 的 最 大 数据 对 象 的 大 
小 ， 因 此 岂 乎 可 以 肯定 它 是 unsigned int 或 者 unsigned long 类 型 。 它 总 是 一 
个 和 上 面 所 讲 的 有 符号 类 型 ptraiff_t 具有 相同 位 数 的 无 符号 类 型 。 


然而 ， 和 ptrdiff_t 不 同 的 是 ，size_t 非常 有 用 。 它 是 表示 用 作 数 组 
再 标的 任意 整数 数据 对 象 的 最 安全 的 类 型 。 使 用 它 就 不 必 担 心 小 的 数组 会 随 
着 程序 的 变化 而 演变 为 很 大 的 数组 ， 而 且 使 用 size t+ 上 时， 下 标 算术 永远 都 
不 会 溢出 。 也 不 必 担 心 程序 是 否 能 移植 到 某 些 具 有 特殊 属性 的 机 器 中 ， 例 如 
32 位 的 字 节 和 单字 节 long 类 型 。 类 型 size t 为 代码 的 稳定 性 提供 了 最 大 的 
保障 。 计 算数 据 对 象 大 小 的 唯一 可 用 的 类 型 就 是 size t. 


C 标准 库 广 泛 使 用 了 sizet 上 类型， 很 多 函数 的 参数 和 返回 值 都 声明 为 
这 种 类 型 。 对 于 那些 经 常 导 致 程序 漏洞 的 旧 的 编程 习惯 来 说 ， 这 是 一 种 刻意 
的 改变 ， 它 抛弃 了 把 所 有 的 整数 都 声明 为 int 类 型 ， 这 也 是 一 种 趋势 。 


在 程序 中 所 有 对 数组 下 标 或 者 地 址 进行 算术 操作 的 地 方 ， 都 应 该 使 用 
size_t 类 型 。 然 而 ， 无 符号 整数 运算 比 有 符号 运算 的 缺陷 更 多 。 例 如 不 能 使 
一 个 无 符号 计数 器 递减 到 一 个 负数 一 -永远 都 不 会 。 如 果 翻 译 器 不 对 这 样 的 
判断 表达 式 发 出 警告 ， 程 序 就 可 能 会 陷入 死 循 环 。 事实 上 ， 有 时 候 递减 到 等 
会 使 得 判断 很 不 灵活 。 所 以 ， 有 时 候 会 因为 没有 使 用 负 值 “例如 <stdio.h> 
中 定义 的 表示 文件 结束 的 EoF〉 而 不 能 方便 地 对 它们 进行 判断 ， 当 然 ， 健 壮 
性 方面 的 改进 很 值得 进一步 研究 。 


本 书 中 的 代码 在 所 有 适合 的 地 方 都 使 用 了 size_t 类 型 。 有 时 候 读者 可 
能 会 在 某 些 地 方 使 用 如 数据 对 象 表示 下 标 。 然 而 ， 在 所 有 这 样 的 情况 下 ， 
相关 的 数组 数据 对 象 的 大 小 应 该 很 自然 地 被 限制 在 一 个 安全 的 大 小 范围 内 。 
只 有 当 必须 将 负 值 和 下 标 混合 使 用 的 时 候 ， 我 才 这 样 做 。 

写 -个 宽 字 节 字 符 的 字符 囊 字面 量 ， 例 如 写 为 4'x'， 它 的 类 型 就 是 wchar_t; 
写 一 个 宽 宁 节 字 符 文本 字符 囊 ， 例 如 写 为 L"hello"， 它 的 类 型 为 wchar_t 数 
组 。wchar_t 是 一 个 整数 类 型 ， 它 可 以 表示 实现 支持 的 所 有 宽 字 节 字 符 编码 
的 所 有 编码 值 。 
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Nt 


对 于 一 个 只 对 宽 字 节 字 符 提 供 最 小 支持 的 实现 来 说 ，wchar tc 可 能 和 
char 一 样 小 。 对 于 一 个 非常 大 的 实现 ， 它 可 能 和 unsigned long 一 样 大 。 更 多 
情况 下 ，wchar_t 是 一 个 至 少 具有 16 位 表示 、 像 short 或 者 unsigned short 这 
样 的 整数 类 型 。 


可 以 用 wchar_t 来 表示 所 有 必须 保存 宽 字 节 字符 的 数据 对 象 。<stalib. 
h» 中 声明 的 函数 中 有 几 个 是 对 宽 字 节 字符 进行 操作 ， 一 次 操作 一 个 字符 或 者 
以 空 字符 结尾 的 字符 串 的 一 部 分 这 组 函数 中 很 多 函数 的 参数 和 返回 值 都 启明 
为 这 种 类 型 。 因 此 ， 头 文件 <stdlib.h> 也 定义 了 wchar_t 类 型 。 


"E NULL 几乎 可 以 作为 一 个 几乎 通用 的 空 指针 常量 使 用 ， 可 以 把 它 作 
为 不 指向 程序 声明 (或 者 分 配 ) 的 任何 数据 对 象 的 数据 对 象 指针 的 值 使 用 。 
如 11.1 节 提 到 的 那样 ， 这 个 宏 可 以 是 定义 0、07 或 者 (voidq*)0 中 的 任 
意 一 个 。 


最 后 一 个 定义 和 所 有 的 数据 对 象 指针 兼容 ， 但 与 函数 指针 不 兼容 。 这 就 
意味 着 不 能 这 样 写 代码 : 


int (*pfun) (void) = NULL; /*WRONG */ 
翻译 器 可 能 会 警告 表达 式 类 型 和 要 初始 化 的 数据 对 象 的 类 型 不 兼容 。 


NULL 的 一 个 重要 的 传统 用 途 现在 已 经 不 用 了 。C 语言 的 早期 版 本 没有 
函数 原型 。 翻 译 器 不 能 检查 函数 调用 的 参数 表达 式 是 否 和 相应 的 函数 参数 声 
明 兼 容 。 因 此 ， 它 不 能 对 一 个 可 兼容 但 是 类 型 不 同 的 表达 式 的 表示 《〈 例 如 把 
tan(1) 改 为 tan(1.0)) 进行 调整 。 所 以 程序 员 必 须 保证 每 一 个 参数 值 都 有 
正确 的 表示 。 


现代 编程 风格 是 对 调用 的 所 有 函数 都 要 声明 冰 数 原型 。 然 而 ， 存 在 一 种 
重要 的 情况 ， 当 调用 一 个 接受 可 变 参 数 表 的 困 数 〈 像 <stdio.h> 中 声明 的 
printf) 时 ， 函 数 的 参数 就 没有 对 应 的 参数 声明 。 对 那些 附加 的 参数 ， 旧 的 
C 规则 也 适用 。 当 然 ， 其 中 会 发 生 一 些 标准 的 类 型 转换 。 但 是 大 部 分 时 候 ， 
每 个 这 样 的 参数 是 否 正确 ， 是 由 程序 员 决 定 的 。 


在 C 语言 最 早 的 实现 中 ， 所 有 指针 的 表示 都 相同 。 通 常 ， 这 个 表示 和 整 
数 类 型 int 或 者 long 中 的 一 个 大 小 相同 。 因 此 ， 十 进 制 常 数 0 或 者 OL 中 的 任 
何 一 个 都 很 有 可 能 被 误 认为 是 某 种 类 型 的 空 指针 。 把 NULL 定义 为 这 两 个 常数 
中 的 一 个 ， 然 后 就 可 以 把 它 赋 给 一 个 任意 的 指针 。 这 个 宏 作 为 一 个 参数 表达 式 
的 时 候 特 别 有 用 ， 它 说 明 这 个 表达 式 为 某 种 指针 类 型 并 且 是 一 个 空 指针 常 其 。 


后 来 出 现 了 一 些 实现 ， 它 们 认为 指针 和 所 有 整数 类 型 都 有 很 大 的 不 同 。 
编写 空 指针 唯一 安全 的 方式 是 使 用 强制 类 型 转换 ， 就 像 (char “)0。 如 果 所 
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$ offsetof 


有 的 指针 看 起 来 都 相同 ， 仍 然 可 以 将 NULL 定义 为 类 似 (char *) 0 这 样 。 这 
个 宏 仍然 可 以 作为 编写 参数 表达 式 的 一 种 有 效 的 方法 。 

标准 C 人 允许 不 同 的 指针 类 型 有 不 同 的 表示 。 完 全 可 以 把 任意 的 数据 对 象 
指针 转换 为 指向 char 的 指针 类 型 (或 者 指向 signed char 的 指针 ， 或 者 是 指向 
unsigned char 的 指针 )， 并 且 可 以 不 用 损失 任何 信息 就 能 把 它 转换 回来 。 可 以 
方便 地 把 指向 void 的 指针 作为 一 般 的 数据 对 象 指针 类 型 使 用 ， 特 别 是 声明 瑞 
数 参 数 和 返回 值 的 时 候 。 


在 这 样 的 实现 中 ，NULL 最 安全 的 定义 是 (voidqx*)0。 但 是 ， 这 不 能 保证 
指向 void 的 指针 和 任何 其 他 的 〈 非 字符 ) 指针 有 相同 的 表示 ， 它 甚至 不 能 和 
函数 指针 赋值 兼容 。 因 此 ， 不 能 把 NULL 编写 为 一 个 通用 的 空 指针 常量 ， 也 不 
能 安全 地 把 它 作为 一 个 参数 表达 式 来 代替 一 个 任意 的 数据 对 象 指 针 。 我 们 只 
能 保证 它 可 以 作为 一 个 字符 指针 或 者 一 个 通用 的 指向 void 的 指针 正确 使 用 。 

编写 C 程序 的 一 种 现代 风格 是 完全 避免 使 用 NULL。 用 一 个 合适 的 强制 
类 型 转换 来 编写 每 一 个 空 指针 常量 ， 像 (int *)0 这 样 。 虽 然 这 样 会 增加 程 
序 的 长 度 ， 但 是 会 使 程序 变 得 很 明确 。 这 种 风格 的 一 个 改进 是 在 所 有 需要 的 
地 方 简单 地 写 一 个 0 来 作为 空 指针 常量 。 这 对 翻译 器 来 已 经 足够 清楚 了 ， 但 
是 对 代码 的 阅读 者 就 不 同 了 。 

本 书 使 用 的 风格 是 尽 可 能 多 地 使 用 NULL。 存 在 空 指 针 常 量 是 一 个 非常 有 
用 的 信号 。 我 使 用 强制 类 型 转换 生成 用 于 函数 指针 的 空 指针 常量 。 我 也 用 它 
们 来 表示 接受 可 变 参数 表 的 函数 参数 ， 特 别 是 当 要 求 的 类 型 不 是 指向 void 的 
指针 的 时 候 。 

NULL 在 6 个 不 同 的 头 文件 中 都 有 定义 ， 很 容易 使 用 。 唯 一 的 建议 就 是 选 
择 一 种 风格 ， 然 后 坚持 使 用 它 。 

Å offsetof 用 来 确定 结构 的 一 个 成 员 距 离 结构 起 始 位 置 的 偏 移 量 〈 以 
字 节 为 单位 )。 如 果 想 使 用 一 个 表 驱 动 函 数 来 对 一 个 结构 的 单个 成 员 进 行 操 
fe, iX -点 很 重要 。 例 如 ， 可 以 参考 图 6-15 的 函数 _Makeloc 和 图 6-13 的 表 
. Loctab, 

这 个 宏 的 结果 是 -- 个 size t 类 型 的 整 型 常量 表达 式 ， 这 意味 着 可 以 用 
它 来 初始 化 一 个 静态 数据 对 象 ， 例 如 一 个 具有 整 型 元 素 的 常量 表 。 这 也 是 实 
现 它 的 唯一 可 移植 的 方法 ， 如 果 编 写 下 面 的 代码 : 


Static size t off = (char *)&x-»b - (char *)&x; 
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则 最 后 一 个 声明 的 行为 是 未 定义 的 。 有 些 实现 选择 了 求 取 初始 化 式 的 
值 ， 并 得 到 那个 明显 的 结果 ， 其 他 的 实现 则 选择 了 诊断 这 个 表达 式 。 

也 不 能 通过 执行 指针 算术 实现 从 成 员 到 成 员 的 步 进 ，<stdarg.h> 中 定 
义 的 宏 可 以 实现 对 一 个 接受 可 变 参数 表 的 函数 执行 从 参数 到 参数 的 步 进 。 那 
ER, 或 者 类 似 于 它们 的 宏 ， 不 能 保证 在 一 个 结构 内 正常 运作 ， 因 为 结构 成 
员 之 间 的 空隙 和 顶 数 参数 之 间 的 空隙 不 同 。 实 际 上 ， 它 们 不 需要 遵循 任何 备 
有 文档 的 规则 。 


需要 使 用 宏 of fsetof 来 编写 可 移植 的 代码 ， 如 : 


#include «stddef.h» 


) x 
static size t off - offsetof(struct xx, b); 


11.4 «stddef.h» 的 实现 


头 文件 


<yvals.h> 


E offsetof 


图 11-1 显示 了 文件 stadef .h， 它 非常 简单 。 我 又 一 次 使 用 了 内 部 头 文 
ff <yvals.h> 来 提供 随 实 现 改变 的 信息 。 在 这 种 情况 下 ， 那 些 信息 确定 了 
所 有 的 3 个 类 型 定义 和 宏 NULL 的 形式 。 头 文件 «yvals.h» 一 般 包含 以 下 
的 定义 : 

typedef int  Ptrdifft; 

typedef unsigned int Sizet; 


typedef unsigned short Wchart; 
#define NULL (void *)0 


这 些 定义 在 很 多 实现 上 都 可 以 工作 。 然 而 ， 某 些 实现 可 能 要 求 对 它们 中 的 一 
个 或 者 多 个 进行 修改 ， 这 就 是 对 它们 进行 参数 化 的 原因 。 


对 宏 offsetof， 我 使 用 了 一 个 常用 的 技巧 。 很 多 实现 都 允许 通过 强制 类 
型 转换 把 一 个 整数 零 转换 为 一 个 指针 类 型 ， 然 后 对 结果 执行 指针 算术 。C 标 
准 没 有 定义 这 种 行为 ， 所 以 有 些 实现 可 能 不 支持 它 。 


翻译 器 必须 允许 这 种 宏 定义 ， 这 样 才 可 以 正确 工作 。 在 size_t 隐藏 起 
来 的 时 候 ， 翻 译 器 必须 通过 强制 类 型 转换 把 一 个 零 开 头 的 (zero_based) 地 
址 转换 回 一 个 整数 类 型 。 而 且 ， 它 必须 容忍 整 型 常量 表达 式 中 这 样 滑稽 的 行 
为 。 这 也 就 是 初始 化 静态 数据 对 象 所 需要 的 。 

幸运 的 是 ， 很 多 翻译 器 都 允许 这 样 做 。 如 果 某 个 实现 不 允许 ， 就 必须 考 
虑 实现 希望 用 户 怎 样 定义 offsetof。 为 了 遵循 C 标准 ， 每 一 个 实现 都 必须 
提供 某 种 方法 。 
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图 11-1 /* stddef.h standard header */ 
stddef.h #ifndef _STDDEF 
#define _STDDEF 
#ifndef _YVALS 
#include <yvals.h> 
fendif 
/* macros */ 
#define NULL NULL 
#define offsetof(T, member) (( Sizet)&((T *)0)->member) 
/* type definitions */ 
fifndef  SIZET 
#define -SIZET 
typedef  Sizet size t; 
fendi f 
#ifndef WCHART 
#define _WCHART 
typedef _Wchart wchar t; 
fendif 
typedef  Ptrdifft ptrdiff t ; 
dendif 


11.5 «stddef.h» 的 测试 


图 11-2 显示 了 文件 tstddef.c, FÅR T «stddef.n» 中 定义 的 类 型 
和 宏 的 基本 属性 。 该 文件 是 一 个 简短 的 程序 ， 因 为 它 提供 可 供 测 试 的 东西 
非常 少 。 这 个 程序 也 显示 了 size_t 和 wchart 类 型 的 数据 对 象 的 大 小 。 
(ptrdiff_t 和 size_t 的 大 小 相同 .》 如 果 一 切 顺 利 ， 程 序 显 示 类 似 下 面 的 
输出 : 

sizeof (size t) = 4 


sizeof (wchar t) = 2 
SUCCESS testing <stddef.h> 


116 参考 文献 


P. J. Plauger, “Data-Object Types,” The C Users Journal, 6, no. 3 (March/April 
1988). 这 篇 文章 讨论 了 和 本 章 的 话题 相关 的 几 个 问题 。 


11.1 ”确定 你 的 实现 为 ptrdiff t, size_t 和 wchar 七 选择 的 整数 类 型 。 
11.2” 写 一 个 程序 ， 该 程序 可 以 用 实验 方法 确定 可 以 代替 wehar c 的 整数 类 型 。 


113 ”编写 一 个 程序 ， 该 程序 可 以 用 实验 方法 确定 可 以 代替 ptrdiff_t 和 wchar_t 
的 整数 类 型 。 
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图 11-2 [7* test stddef definitions */ 
tstddef.c #include «assert.h» 
finclude «limits.h» 
#include <stddef.h> 
#include <stdio.h> 


/* type definitions */ 
typedef struct { 
char fl; 
struct { 
float flt; 
) £2; 
int f3; 
) Str: 


/* static data */ 
Static char *pc - NULL; 
static double *pd - NULL; 
static size t offs[] - ( 
offsetof(Str, f1), 
offsetof(Str, f2), 
offsetof(Str, f3)); 


int main() 
{ /* test basic workings of stddef definitions */ 
ptrdiff t pd = &pc[INT MAX] - &pc[0]; 
wchar t wc = L'Z'; 
Str x - (1, 2, 3); 
char *ps = (char *)&x; 
assert(sizeof (ptrdiff t) -- sizeof (size t)); 
assert(sizeof (size t) == sizeof (sizeof (char))): 
assert(pd -- &pc[INT MAX] - &pc[0]); 
assert(wc == L'Z'); 


assert(offs[0] < offs(1]); 
assert(offs[1] < offs[2]); 


assert(*(char *)(ps + offs [0]) == 1); 
assert(*(float *) (ps + offs[l] ) == 2); 

assert(*(int *) (ps + offs[21]) == 3); 

printf("sizeof (size t) = %uln", sizeof (size t)); 
printf("sizeof (wchar t) = $uMn", sizeof (wchar_t)); 


puts("SUCCESS testing «stddef.h»"); 
return (0); 
} 口 


11.4 【 难 ] 某 些 实现 允许 对 一 个 整 型 常量 表达 式 中 的 两 个 指针 相 减 ， 前 提 是 它们 都 
以 某 个 静态 数据 对 象 声 明 为 起 点 ， 写 出 一 个 可 以 利用 这 种 功能 的 offsetof 
的 定义 。 

11.5 [RE] 把 一 个 空 指 针 常 量 添 加 到 C 语言 中 。 关 键 字 nul 是 一 个 和 所 有 的 指针 
类 型 兼容 的 空 指针 。 如 果 没 有 相应 的 参数 声明 ， 如 何 把 nul 作为 参数 表达 式 
处 理 ? 


输入 /输出 
模型 


逻辑 单元 数 


<stdio.h> 


头 文件 <staio.bh> 声明 了 很 多 执行 输入 输出 的 函数 。 几 乎 所 有 的 程序 都 
要 执行 输出 操作 ， 所 以 这 个 头 文件 被 广泛 使 用 。 事 实 上 ， 它 是 最 早出 现在 C 
标准 库 中 的 头 文件 之 一 。 这 个 头 文件 比 其 他 任何 头 文件 声明 的 函数 都 要 多 。 
同时 由 于 实现 这 些 函数 机 制 很 复杂 ， 因 此 它 也 需要 更 多 的 说 明 。 

本 章 主要 讨论 以 下 几 个 话题 

O C 标准 库 实现 的 抽象 输入 / 输出 模块 
品读 出 和 写 入 原始 数据 的 低级 函数 
口 作 格 式 规范 控制 下 打印 和 扫描 数据 的 高 级 函数 。 
我 们 从 历史 的 角度 开始 讨论 。 

在 过 去 的 几 十 年 里 ， 计 算 机 编程 的 某 个 领域 得 到 了 飞速 的 发 展 ， 但 它 的 
成 功 并 没有 得 到 足够 的 认可 。 我 指 的 是 在 过 去 的 二 十 年 左右 和 高 级 语言 一 起 
得 到 提高 的 独立 于 设备 的 输入 输出 模型 。 标 准 C JC P AK a 


# 


TE 20 th £i 60 F (€ MR. FORTRAN IV 被 认为 是 独立 于 机 器 的 语 

。 但 是 如 果 不 作 任何 改动 ， 根 本 不 可 能 在 各 种 计算 机 体系 结构 间 移 动 
FORTRAN IV 程序 。 可 移植 性 的 主要 障碍 是 输入 输出 〈 简 写 为 TO) 领域 。 
在 FORTRAN IV 中 ， 可 以 对 FORTRAN IV 代码 中 间 的 WO 语句 中 对 正在 通 
信 的 设备 进行 命名 。 例 如 ， 在 面向 磁带 的 机 器 IBM 7090 上 读 输 入 卡片 时 ， 
就 用 READ INPUT TAPE 5， 但 是 在 其 他 的 机 器 上 就 用 READ CARD。 打 印 结果 
时 ， 使 用 WRITE OUTPUT TAPE 6, PRINT 或 者 TYPE。 


后 来 FORTRAN IV 出 现 了 并 提供 了 一 个 出 路 。 现 在 可 以 编写 更 多 通用 的 
READ 和 WRITE 语句 ， 每 一 条 语句 都 指定 了 逻辑 单元 数 ( 或 者 LUN) 来 代替 
具体 的 设备 名 。 这 样 就 必须 在 可 执行 的 二 进 制 卡片 前 加 入 控制 卡片 ， 这 样 就 
可 以 指定 在 这 个 特殊 的 运行 过 程 中 哪些 设备 和 哪些 LUNs 相对 应 。 独 立 于 设 
备 的 vo 时 代 来 临 了 。 


nil 
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PIP 功能 


进入 UNIX 
时 代 


系统 调用 


ioctl 


设备 管理 器 


当然 ， 外 围 设备 很 清楚 地 知道 用 户 想 要 它们 做 的 事情 。 例 如 ， 当 向 打印 
机 输入 字符 时 ， 每 一 行 的 第 一 个 字符 被 转化 为 控制 回 车 空格 。 把 相同 的 行 送 
向 打字 机 ， 就 会 打印 出 回 车 控制 字符 。 与 磁带 和 磁盘 文件 的 阻塞 问题 、 二 进 
制 卡 片 格式 或 者 怎样 对 各 种 输入 指定 文件 结束 相 比 ， 回 车 控制 只 是 一 个 很 小 
的 问题 。 很 快 ， 我 们 就 能 学 会 可 以 选择 哪些 成 对 的 设备 来 进行 某 种 输入 输出 
了 。 


设备 独立 的 进一步 改善 得 益 于 标准 外 围 交换 程序 (peripheral interchange 
programn， 简 称 PIP) 的 进步 ， 该 程序 允许 指定 源 设备 与 目标 设备 的 任意 组 
成 ， 然 后 尽力 执行 两 个 设备 间 的 拷贝 操作 。 通 常情 况 下 ， 必 须 指 定 一 些 特殊 
的 选项 来 使 PIP 尽 可 能 选择 正确 。 但 是 不 论 提 供 了 多 少 提示 ， 有 时 候 还 是 不 
能 得 到 某 些 想 要 的 组 合 。 


后 来 CRT 终端 产生 了 ， 然 后 每 个 人 都 可 以 单 步 地 退回 。 结 束 一 行 是 
用 回 车 还 是 回 车 加 上 换行 ， 或 者 是 换行 符 ， 还 是 某 些 更 加 神奇 的 字符 ? 
终端 允许 水 平 制 表 符号 设置 和 展开 制 表 符 吗 ? 还 是 不 允许 使 用 制 表 符 ? 
怎样 用 键盘 标志 文件 结束 昵 ? 这 些 问题 的 答案 几乎 和 CRT 终端 的 厂商 一 
HZ. 


20 世纪 70 年 代 早期 出 现 了 UNIX。 该 著名 系统 的 开发 者 Ken Thompson 
和 Dennis Ritchie, HFA UNIX 注入 了 很 多 好 的 思想 而 得 到 了 应 得 的 赞扬 。 
他 们 设计 的 关于 设备 独立 的 方法 是 最 好 的 方法 之 一 。 


UNIX 对 所 有 的 文本 流 都 采用 了 标准 内 部 形式 ， 文 本 的 每 一 行 以 换行 符 
终止 。 这 正 是 程序 读 入 文本 时 所 期 望 的 ， 也 是 程序 输出 时 所 产生 的 。 假 如 这 
样 的 约定 不 能 满足 和 UNIX 机 器 相连 的 处 理 文本 的 外 围 设备 的 需要 ， 可 以 在 
系统 的 对 外 接口 作 些 修改 ， 不 必修 改 任何 内 部 代码 。 


UNIX 提供 了 两 种 机 制 来 修正 “对 外 接口 ”的 文本 流 。 首 选 的 机 制 是 
一 个 通用 的 映射 函数 ， 它 可 以 用 任意 的 文本 处 理 设 备 工作 。 可 以 用 系统 调 
用 ioct1 来 设置 或 者 测试 一 个 具体 设备 的 各 种 参数 。 使 用 ioctl 就 可 以 
《在 其 他 事情 中 ) 对 内 部 换行 约定 和 各 种 终端 的 需要 之 间 的 各 种 转换 进行 选 
择 。 近 年 来 ，ioct1l 已 经 演变 为 一 个 非常 成 熟 的 小 PIP， 它 用 来 控制 文本 
处 理 设备 。 


另 一 个 修正 文本 流 的 机 制 是 修改 直接 控制 该 设备 的 专门 软件 。 对 每 一 个 
UNIX 可 能 需要 控制 的 设备 来 说 ， 用 户 必 须 添加 -- 个 常 驻 UNIX 的 设备 管理 
Z. (MS-DOS 采用 了 类 似 的 机 制 .) 里 期 ，Thompson 和 Ritchie 发 布 了 一 个 
先例 ， 就 是 每 个 设备 都 应 该 在 所 有 需要 的 场合 处 理 标准 文本 流 。 
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文件 描述 符 


二 进 制 流 


文件 长 度 


C 的 迁移 


当 Dennis Ritchie 使 第 一 个 C 编译 器 在 PDP-11 UNIX 平台 上 运行 时 ，C 
语言 就 白 然 地 继承 了 它 的 宿主 操作 系统 简单 的 VO 模型 。 除 了 文本 流 的 统一 - 
表示 ， 还 有 其 他 一 些 优点 。 很 入 以 前 使 用 的 LUNs 在 最 近 儿 十 年 也 慢 慢 地 演 
变 为 称 为 文件 描述 符 或 句柄 的 非常 小 的 正 整 数 。 操 作 系 统 负责 分 发 文件 描述 
符 ， 并 革 把 所 有 的 文件 控制 信息 存储 在 自己 的 专用 内 存 中 ， 而 不 是 让 用 户 去 
分 配 和 维持 文件 和 记录 控制 块 以 加 重负 担 。 

为 了 简化 多 数 程序 的 运行 管理 ，UNIX shell 分 配给 每 个 运行 的 程序 
3 个 标准 文件 描述 符 ， 这 些 就 是 现在 普遍 使 用 的 标准 和 输入、 标准 输出 和 
标准 错误 流 。( 严 格 地 说 ， 它 们 不 是 UNIX 的 发 明 ， 因 为 它们 在 PLA 和 
MULTICS 等 操作 系统 中 就 已经 出 现 了 。) 程序 员 迅 速 学 会 了 在 所 有 可 能 好 
情况 下 部 从 标准 输入 流 读 取 文本 并 输出 文本 到 标准 错误 流 。 软 件 工具 也 因 
此 而 产生 。 

另外 一 个 很 小 但 是 很 重要 的 改进 是 8 位 透明 性 。UNIX 并 不 会 阻止 向 
任意 打开 的 文件 中 写 入 任意 的 三 进 制 编码 ， 或 者 从 一 个 足够 大 的 地 方 把 它 
们 丝毫 不 变 地 读 取 出 来 。 确 实 ， 把 二 进 制 编 码 写 入 -- 个 文本 处 理 设备 可 能 
会 产生 很 多 奇怪 的 结果 ， 但 是 一 个 文件 或 者 管道 通常 可 以 并 且 愿 意 存 储 任 “ 
意 的 二 进 制 流 。 程 序 员 最 终 学 会 了 让 程序 容纳 任意 的 二 进 制 编码 ， 无 论 什 
么 时 候 这 者 是 有 必要 的 ， 即 使 这 些 程序 是 作为 文本 处 理工 具 而 开发 的 。 所 
El, UNIX 消除 了 文本 流 〈 与 人 通信 ) 和 二 进 制 流 〈 与 程序 通信 ) 之 间 的 
区 别 。 

还 有 一 点 改进 是 精确 长 度 的 文件 。 大 部 分 操作 系统 都 尝试 过 将 保存 在 人 磁 
融 、 磁 带 或 者 其 他 存储 设备 上 的 文件 的 底层 块 结构 隐藏 起 来 ， 但 很 多 都 六 途 
而 废 。 当 把 数据 写 到 文件 中 ， 然 后 再 读 回来 的 时 候 ， 可 能 会 有 1 到 1000 个 
额外 的 字符 被 深 加 到 了 文件 的 末尾 。UNIX 用 最 接近 的 字 节 数 来 记录 文件 的 
大 小 ， 所 以 最 后 得 到 的 就 是 写 到 文件 中 的 内 容 。 设 备 处 理 器 的 程序 员 通 常 都 
知道 提供 -种 机 制 ， 这 种 机 制 可 以 保证 出 入 设备 的 数据 流 的 整洁 性 。 因 此 它 
又 回 到 了 对 曾经 风靡 :时 的 PIP 的 需求 上 。( 注 意 ， 尽 管 如 此 ，UNIX 仍然 使 
用 da 命令 一 一 现代 的 PIP。) 

相似 地 ， 创 建 临 时 文件 不 需要 提前 作 准 备 ， 甚 至 不 需 任 何 思考 。 大 部 分 
情况 是 道 过 管道 将 不 同 作者 编写 的 C 程序 连 到 一 起 进行 工作 。 那 些 分 发 给 各 
个 大 学 的 早期 的 UNIX 系统 培养 了 一 批 程序 员 ， 他 们 不 用 考虑 实际 的 输入 输 
出 的 各 种 糟糕 的 情况 ， 而 在 当时 其 他 的 操作 系统 下 则 不 是 这 样 。 

当 C 从 UNIX 转移 到 其 他 操作 系统 的 时 候 ， 就 没有 这 么 好 的 事 了 。 我 
们 处 理 最 早 的 实现 时 ， 遇 到 了 一 些 环 手 的 决定 。 我 们 应 该 保留 C 程序 员 已 经 
习惯 的 简单 的 WO 模块 ， 还 是 修改 WO 库 来 适应 本 地 习惯 ? 至 少 从 哲学 上 讲 ， 
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这 个 问题 很 简单 。 几 乎 没有 C 程序 员 希 望 在 打开 文件 时 操作 文件 控制 块 或 者 
指定 无 数 的 参数 一 一 更 不 用 说 多 年 来 简单 的 VO 了 。 大 多 数 人 都 选择 了 尽 可 
能 多 地 保留 简单 的 VO 模块 。( 我 们 也 为 那些 习惯 本 地 操作 系统 的 人 提供 了 一 
些 能 够 吸引 他 们 的 东西 。) 


问题 是 我 们 把 那些 繁琐 的 细节 隐藏 在 什么 地 方 ? UNIX 把 它们 大 部 分 封 
RE ioctl 和 设备 处 理 程 序 中 。 一 般 来 说 ， 我 们 没有 那个 选项 。 因 此 ， 我 
们 必须 构建 更 多 复杂 的 库 来 处 理 各 种 设备 和 表示 文本 的 不 同 习惯 。 要 保证 C 
可 以 读 取 和 写 入 那些 和 本 地 文本 编辑 器 兼容 的 文本 文件 ， 这 一 点 很 重要 。C 
也 必须 至 少 可 以 从 键盘 读 取 文本 并 将 其 写 入 显示 设备 和 打印 机 。 需 要 的 时 
候 ， 库 要 在 内 部 的 以 换行 符 终止 的 文本 行 和 外 部 的 本 地 用 法 之 间 进 行 转换 。 


在 非 UNIX 系统 下 ， 我 们 不 能 把 这 些 繁琐 的 东西 全 部 隐藏 起 来 。 因 此 ， 
我 们 实现 者 又 面临 的 一 个 决定 是 ， 当 我 们 不 能 把 它们 隐藏 起 来 的 时 候 如 何 利 
用 它们 。 那 些 厂商 通常 只 在 一 种 环境 下 实现 C 库 ， 他 们 就 在 现 有 的 WO 函数 
中 添加 了 很 多 复杂 的 东西 ， 并 且 添 加 了 很 多 新 函数 。 而 我 们 的 目标 则 是 在 多 
个 系统 之 间 构 建 统一 而 且 强大 的 环境 ， 所 以 我 们 必须 更 加 谨慎 。 这 就 意味 着 
HERAK VO 函数 中 添加 最 小 的 复杂 性 ， 并 且 尽 可 能 少 地 添加 新 的 函数 。 
同时 也 意味 着 要 削弱 UNIX LO 模块 的 某 些 承 诺 来 满足 各 种 系统 之 间 那 些 不 
通用 的 命名 。 


X3J11 委员 会 在 1983 年 开始 召开 会 议 为 CEE ANSI 标准 。 非 UNIX 系 
统 的 C 厂 商 和 那些 UNIX 用 户 之 闻 争 论 了 很 长 时 间 ， 因 为 UNIX 用 户 不 能 理 
解 VO 为 什么 要 这 么 麻烦 。 这 是 一 个 很 有 教育 意义 的 过 程 。 这 些 争论 的 一 个 
重要 的 副产品 就 是 更 清楚 地 阐明 了 C 支持 的 VO 模块 。 


开始 的 时 候 ， 标 准 C 不 得 不 再 次 引入 文本 文件 和 二 进 制 文件 之 间 的 差 
别 ， 因 为 UNIX 之 外 的 大 部 分 操作 系统 都 迫使 实现 区 别 对 待 这 两 种 文件 。 例 
如 ，MS-DOS 对 文本 文件 和 二 进 制 文件 允许 使 用 相同 的 系统 调用 ， 但 是 在 文 
本 文件 中 结束 每 一 行 的 时 候 它 都 使 用 回 车 和 换行 。C 读 取 文 本 文件 的 时 候 必 
须 丢 弃 回 车 符 ， 但 是 读 取 二 进 制 文件 的 时 候 又 不 是 这 样 。 因 此 ， 即 使 我 们 认 
为 不 应 该 有 区 别 ， 这 种 区 别 也 是 实际 存在 的 。 


打开 文件 的 时 候 可 以 指定 一 个 文件 是 作为 文本 文件 还 是 二 进 制 文件 进行 
处 理 。 例 如 ， 可 以 用 fopen(fname,"r") 来 打开 一 个 文件 供 程序 读 取 ， 在 标 
HEC 中 ， 这 种 形式 默认 为 打开 文本 文件 。 如 果 要 打开 一 个 binary 文件 ， 可 


. 以 用 fopen(fname, "rb")。 也 可 以 把 b 加 到 其 他 任意 模式 下 。(b 放 在 模式 


中 + 的 前 面 和 后 面 都 是 允许 的 。) 


结束 文本 行 


文本 行 长 度 


文件 长 度 
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在 UNIX 和 其 他 不 区 别 这 两 种 形式 的 系统 下 ， 可 以 忽略 b 模式 限定 符 。 
然而 ， 在 很 多 系统 下 ， 这 种 区 别 非常 重要 。 如 果 程 序 要 移植 到 其 他 系统 ， 就 
要 考虑 文件 是 怎么 使 用 的 ， 然 后 正确 地 编写 fopen 模式 。 否 则 ， 程 序 可 能 会 
在 各 种 细节 方面 出 错 。 


要 设计 一 个 文本 文件 使 它 严格 支持 文本 流 的 UNIX 模式 并 不 总 是 那么 容 
易 的。 就 像 本 节 前 面 讲 PIP 时 提 到 的 那样 ， 文 本 行 结束 就 有 很 多 种 方式 。 因 
此 ， 实 现 要 能 自由 地 把 外 部 各 种 文件 格式 正确 地 转换 为 程序 所 能 读 的 格式 ， 
也 能 把 程序 所 写 的 内 容 转 换 为 外 部 其 他 程序 可 以 使 用 的 形式 。 这 个 自由 要 包 
括 写 到 文本 文件 的 字符 集 、 如 何 构建 文件 行 ， 甚 至 零 和 空 之 间 的 区 别 。 


某 些 系统 在 向 文本 文件 输出 的 时 候 不 支持 8 位 透明 性 。ctl-Z 在 很 多 流 
行 的 操作 系统 下 都 像 是 文件 结束 符 。 甚 至 C 基本 字符 集中 的 字符 也 是 不 确定 
的 。 某 些 环 境 可 能 不 支持 换 页 符 和 垂直 制 表 符 。 实 际 上 ， 为 了 程序 的 最 大 可 
移植 性 ， 写 入 文本 文件 时 应 该 只 使 用 可 打印 字符 ， 加 上 空格 、 换 行 和 水 平 制 
表 符 。 


如 果 最 后 一 行文 本 不 是 一 整 行 ， 很 多 系统 都 不 能 很 好 地 处 理 它 们 ， 因 为 
没有 结束 符 它们 就 不 能 表示 行 的 概念 。 如 果 写 人 文本 文件 的 最 后 一 个 字符 不 
是 换行 符 ， 那 么 最 后 的 不 完整 的 文本 行 就 可 能 丢失 ;或 者 自动 补充 完整 ， 因 
而 再 次 读 取 的 文本 就 多 了 一 个 换行 符 ， 或 者 程序 运行 的 时 候 会 出 现 问题 。 所 
以 要 避免 文本 文件 的 最 后 一 行 不 完整 。 


某 些 系统 甚至 不 能 表示 空 文本 行 。 因 此 输出 空 文本 行 的 时 候 ， 库 实际 上 
输出 的 可 能 是 只 包含 一 个 空格 的 文本 行 。 在 读 取 的 时 候 ， 系 统 就 会 丢弃 只 包 
含 一 个 空格 的 文本 行 中 的 空格 。 还 有 一 些 系统 丢弃 文 本 行 后 面 的 所 有 空格 。 
因此 ， 如 果 程 序 读 取 一 个 包含 了 固定 长 度 的 文本 记录 的 文件 时 ， 就 会 方便 很 
多 ， 所 有 尾部 空格 都 消失 了 。 但 是 ， 这 就 意味 着 不 能 指望 在 输出 尾部 有 空格 
的 文本 之 后 再 把 那些 空格 读 回 来 。 在 可 移植 程序 中 不 要 这 样 做 。 


另 一 个 极端 是 ， 系 统 可 以 设置 它们 能 读 取 或 者 输出 的 最 长 的 文本 行 长 度 
的 上 限 。 高 于 上 限 的 那些 字符 可 能 会 被 删除 ， 所 以 尾部 的 字符 会 丢失。 或 者 
它们 被 折 匡 ， 然 后 就 可 能 突然 遇 到 原本 不 存在 的 换行 符 。 或 者 程序 运行 的 时 
候 会 报告 错误 。C 标准 保证 的 文本 行 长 度 的 上 限 是 254 NFF. E, E 
处 理 过 反 斜 线 连接 之 后 ， 最 长 的 C 源 文件 行 是 509 个 字符 。) 

某 些 系统 不 能 表示 空 文件 。 如 果 创 建 了 一 个 新 文件 但 没有 写 入 任何 东 


西 ， 然 后 把 它 关闭 ， 系 统 就 没 办 法 将 空 文件 与 不 存在 的 文件 区 分 开 来 。 因 此 ， 
标准 C 允许 实现 在 关闭 空 文件 的 时 候 删 除 它们 。 一 定 要 注意 这 一 点 。 
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另外 ， 一 个 非常 大 的 文件 也 可 能 出 现 问题 。 在 UNIX 下 ， 可 以 用 一 个 32 
位 的 整数 表示 文件 中 任意 字 节 的 位 置 。C 传统 的 文件 定位 函数 认为 long 类 型 
可 以 表示 任意 的 文件 位 置 ， 但 在 其 他 的 系统 下 并 非 如 此 ， 即 使 文件 的 长 度 小 
于 2” 个 字 节 。 因 此 ， 委 员 会 向 C 标准 库 中 添加 了 一 个 可 供 选择 的 文件 定位 
函数 集 来 部 分 改善 这 个 问题 。 


在 结束 对 文本 文件 的 正面 讨论 之 前 ， 我 提供 一 点 鼓励 的 话 。 只 要 遵守 所 
有 的 规则 ， 那 么 程序 写 入 文本 文件 的 字符 序列 和 最 后 从 文本 文件 中 读 出 的 字 
符 序列 就 可 以 完全 相同 。 如 果 程 序 有 这 样 的 要 求 ， 就 不 要 存在 侥幸 的 心理 弯 
曲 这 些 规则 。 


对 二 进 制 文件 来 说 所 作 的 妥协 是 重新 引入 长 度 的 不 确定 性 。 实 现 必须 精 
确 地 保留 程序 写 入 文件 开头 的 所 有 字 节 ， 但 可 以 自由 填充 二 进 制 文件 。 只 要 
填充 字符 的 值 为 零 ('\0')， 就 可 以 对 其 添加 任意 数目 。 所 以 设计 二 进 制 文件 
的 时 候 要 更 加 小 心 。 不 要 认为 在 读 取 了 写 到 文件 中 的 最 后 一 个 字符 之 后 就 能 
看 到 文件 结束 符 。 或 者 通过 某 种 方式 得 到 数据 结束 的 标志 ， 或 者 忍受 读 取 数 
据 的 尾部 的 多 个 零 字 节 。 


正如 本 节 前 面 所 提 到 的 ，UNIX VO 在 早期 的 系统 下 表示 非常 简化 。 
UNIX 之 前 设计 的 大 部 分 系统 都 认为 VO 理应 是 一 个 很 复杂 的 操作 ， 它 的 复 
杂 性 不 能 在 执行 的 程序 中 隐藏 。 文 件 有 各 种 各 样 的 结构 ， 反 映 为 它 的 各 种 属 
性 ， 例 如 块 或 者 记录 的 大 小 、 查 找 关 键 字 、 打 印 格式 控制 等 等 很 多 种 。 那 些 
执行 VO 的 系统 调用 必须 指定 这 些 属性 的 不 同 组 合 。 而 且 其 他 信息 位 还 必须 
在 各 个 系统 调用 之 间 保 留 ， 以 记录 每 一 个 流 的 状态 。 


所 以 ， 最 简单 的 事情 似乎 是 系统 要 求 每 一 个 用 户 程 序 分配 存 储 空间 ， 以 
此 传递 或 者 / 和 记录 所 有 这 些 属 性 值 和 其 他 的 状态 信息 位 。 这 个 存储 区 域 称 
为 “数据 控制 块 ^“ 文 件 控制 块 ^“ 记 录 访 问 块 ”或 者 其 他 同样 模糊 的 名 字 。 
在 打开 一 个 文件 之 前 ， 必 须 为 控制 块 开辟 一 块 空间 ， 把 指向 控制 块 的 指针 传 
递 给 打开 文件 的 系统 调用 ， 然 后 把 该 指针 传递 给 所 有 对 这 个 文件 进行 VO 操 
作 的 后 继 系统 调用 。LO 系统 调用 需要 的 其 他 的 参数 全 部 放 到 控制 块 的 各 个 
域 中 。 


如 果 幸 运 的 话 ， 操 作 系 统 的 厂商 会 提供 一 个 汇编 语言 宏 集 合 来 分 配 这 些 
控制 块 并 对 各 种 域 进 行 编 址 。 用 户 要 谨慎 地 使 用 这 些 宏 ， 因 为 大 部 分 厂商 都 
认为 用 户 可 以 自由 地 改变 控制 块 的 大 小 和 布局 。 宏 的 接口 很 稳定 ， 因 为 如 果 
它 改变 的 话 ， 会 给 厂商 的 系统 程序 员 造 成 不 便 。 
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“即使 是 世界 上 最 好 的 宏 包 ， 用 户 仍 然 要 学 习 使 用 它 的 非 结 构 化 的 接口 。 
作为 一 个 规则 ， 汇 编 语 言 几乎 不 能 保证 从 控制 块 的 域 中 读 取 或 者 写 入 适当 类 
型 的 数据 。 更 糟 的 是 ， 这 些 域 非常 多 而 且 有 可 能 相关 文献 记录 得 不 太 好 。 所 
有 用 户 不 能 确定 是 否 要 在 某 个 系统 调用 之 前 设置 某 些 域 ,或 者 在 系统 调用 之 
后 使 用 某 些 域 来 包含 有 意义 的 信息 。 唯 一 确定 的 是 ， 控 制 块 中 的 错误 修改 可 
EE 会 冻结 JO、 损 坏 文件 ， 甚 至 使 系统 崩溃 。 


所 以 当 UNIX 不 再 需要 用 户 存 储 区 的 控制 块 时 ， 才 是 真正 的 进步 。 在 
UNIX 打开 一 个 文件 时 ， 用 户 只 获得 一 个 文件 描述 符 ， 它 是 一 个 小 正 整数 。 
所 有 的 控制 信息 都 保留 在 系统 中 ， 这 样 基本 可 以 避免 用 户 程 序 的 误 操 作 。 由 
于 文件 是 非 结构 化 的 ， 所 以 每 次 WO 系统 调用 时 都 要 指定 一 些 参数 。 把 C 调 
用 的 函数 使 用 的 标量 参数 跟 任 何 具 体 的 实现 下 UNIX 系统 调用 要 求 的 最 小 的 
《和 暂时 的 ) 结构 对 应 起 来 是 非常 简单 的 。 


JA fT UNIX X f& f] VO Bj C gä D open, close, read, write 和 
lseek 等 ， 它 们 在 文件 描述 符 和 LO 缓冲 区 中 通信 。 它 们 支持 简单 的 IO TS 
块 ， 这 些 模块 被 强制 使 用 在 几 十 个 更 加 复杂 的 操作 系统 下 。 人 似乎， 它们 是 标 
TÉ C FIO 原 语 的 理想 候选 。 


然而 ， 存 在 一 个 小 问题 。 当 最 早 为 UNIX 编写 的 程序 直接 调用 这 些 原 
语 时 ， 后 面 的 程序 就 变 得 更 加 复杂 。 它 们 在 用 户 存 储 区 强制 使 用 了 一 个 组 
冲 层 ， 以 此 来 使 出 入 程序 的 数据 的 单位 字 节 所 使 用 的 系统 调用 数目 最 少 。 
程序 每 次 系统 调用 时 读 取 和 写 出 数 百 个 字 节 几乎 总 是 比 一 些 字 节 的 速度 快 
很 多 。 


然后 又 出 现 一 个 标准 库 ， 这 个 库 中 的 函数 就 自动 承担 起 了 分 配 和 释放 组 
冲 区 ， 填 充 和 提取 它们 ， 并 用 统一 的 形式 跟踪 错误 情况 等 责任 。 这 些 函 数 工 
作 时 使 用 指向 控制 流 的 FILE 类 型 的 结构 。 每 一 个 流 数 据 对 象 都 要 记录 相关 文 
件 的 VO 状态 。 它 也 包含 了 一 个 指向 缓冲 区 的 指针 和 附加 的 状态 信息 ， 这 样 
就 可 以 记录 缓冲 区 中 有 用 字 节 的 数目 。 


然后 X3J11 委员 会 一 臻 通过 了 把 流 添 加 到 C 标准 库 中 的 决定 。 很 多 人 
学 习 专 门 使 用 流 来 工作 以 保证 良好 的 VO 性 能 。 甚 至 一 些 C 实现 选择 了 专 
门 实现 WO Ri, MEAT FAR UNIX 风格 的 原 语 ， 因 为 它 的 效率 太 低 
了 。 


某 些 以 UNIX 原 语 为 基础 的 实现 在 调用 read 和 write 的 时 候 ， 经 常 不 
得 不 在 用 户 存储 区 缓冲 数据 ， 要 是 能 在 结构 化 文件 中 对 数据 进行 压缩 和 解压 
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缩 就 好 了 。 使 用 流 函 数 的 用 户 总 是 遭受 两 层 缓 冲 的 折磨 ， 它 不 仅 没 有 改善 性 
能 ， 而 且 经 常 使 那些 交互 式 程序 出 现 问题 。 


所 以 出 现 了 进退 两 难 的 局 面 : 要 提高 程序 的 性 能 必须 在 流 级 别 执行 VO, 
其 至 在 UNIX 下 也 是 如 此 。 可 以 只 根据 几 个 面向 流 的 函数 ， 例 如 fopen、 
fclose、fgetc、fputc、fgetpos 和 fsetpos 等 来 定义 所 有 的 IO。 然 而， 
这 样 做 就 忽略 了 那个 广泛 的 历史 事实 ， 就 是 也 可 以 使 用 更 简单 的 UNIX 风格 
的 原 语 实现 WO。 这 样 就 不 用 使 用 FILE 数据 对 象 和 用 户 空 间 中 分 配 的 缓冲 
了 。 在 非常 小 的 系统 上 用 C 编程 的 人 希望 可 以 节省 额外 的 空间 ， 哪 怕 以 性 能 
为 代价 也 可 以 。 


然而 ， 从 一 个 标准 的 立场 看 ， 不 得 人 心 的 一 个 地 方 就 是 ， 为 了 达到 一 个 
共同 的 目标 而 存在 两 种 不 同 的 机 制 。 委 员 会 经 过 讨论 整洁 的 重要 性 和 向 下 兼 
容 的 重要 性 之 后 ， 决 定 抛弃 UNIX 风格 的 原 语 。 


最 后 ， 这 个 争论 让 大 多 数 人 相信 ， 一 个 实现 总 应 该 添加 open, close 
等 函数 作为 扩展 。 当 然 ， 这 些 函数 不 能 和 用 户 定 义 的 同名 的 函数 或 者 数据 
对 象 冲突 。 这 意味 着 实现 也 可 以 不 提供 这 些 函 数 。 这 又 意味 着 类 似 fopen 
一 定 不 能 调用 open。 而 且 ， 提 供 传统 的 UNIX VO 原 语 也 可 以 不 违背 C Er 
准 。 


委员 会 中 的 某 些 实现 者 甚至 认为 可 以 根据 fgetc 实现 read， 且 这 种 方式 
和 其 他 的 方式 一 样 有 效 ， 或 者 效率 更 高 。 就 像 高 能 物理 中 的 基本 粒子 一 样 ， 
知道 只 有 一 些 函 数 是 原 语 ， 但 是 却 很 难 区 分 哪些 函数 是 原 语 ， 哪 些 水 数 是 在 
其 他 函数 基础 上 构建 起 来 的 。 


实际 上 ， 标 准 C 要 求 流 执行 VO 是 向 后 退 了 一 步 。 现 在 每 一 个 程序 都 
要 在 用 户 存储 区 存放 一 个 复杂 的 控制 块 以 记录 每 一 个 流 的 状态 。 分 配 和 释 
BSH (FILE 数据 对 象 ) 的 时 候 一 定 要 很 小 心 。 不 能 直接 对 控制 块 和 它 
控制 的 缓冲 进行 读 取 或 写 入 。 必 须 按照 某 种 顺序 调用 函数 来 执行 流 的 IO 操 
作 。 


然而 ， 现 在 比 过 去 好 多 了 。 调 用 fopen 打开 一 个 流 的 时 候 《 或 者 程序 开 
始 之 前 打开 3 个 标准 流 的 时 候 )， 系 统 就 分 配 一 个 FILE 数据 对 象 。 用 户 不 必 
知道 FILE 数据 对 象 的 内 部 结构 ， 因 为 用 户 永远 都 不 会 直接 向 它 传递 参数 或 
者 从 它 那里 得 到 某 个 返回 值 。C 标准 库 提供 了 控制 流 所 使 用 的 读 取 和 写 人 参 
数 的 函数 ， 并 且 VO 函数 的 语义 要 求 流 的 行为 要 很 健壮 ， 甚 至 当 用 户 对 它们 
BERENS ET BENK. 
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12.2 C 标准 的 内 容 


<stdio.h> 


size t 


stderr 
stdin 
stdout 


7.9 输入 /输出 <stdio.h> 
7.9.1 简介 
头 文件 <stdio.h> 声明 了 3 种 类 型 、 一 些 宏和 很 多 执行 输入 输出 的 函数 。 
声明 的 类 型 有 size_t (7.1.6 中 有 描述 ); 
FILE 
它 是 一 个 对 和 象 类 型 ， 可 以 记录 控制 流 需要 的 所 有 信息 ， 包 括 它 的 文件 定位 符 、 指 向 相 
关 缓 冲 〈 如 果 有 的 话 ) 的 指针 、 记 录 是 否 发 生 了 读 / 写 错 误 的 错误 指示 符 和 记录 文件 是 否 
结束 的 文件 结束 符 ; 
fpos t 
它 是 一 个 对 象 类 型 ， 可 以 唯一 指定 文件 中 的 每 一 个 位 置 所 需 的 所 有 信息 。 
声明 的 宏 有 NULL (7.1.6 中 有 描述 ); 


_IOFBF 
_IOLBF 
_IONBF 


它们 展开 为 具有 不 同 值 的 整 值 常量 表达 式 ， 适 合作 为 函数 setvbuf 的 第 三 个 参数 使 用 ; 


BUFSIZ 


它 展 开 为 一 个 整 值 常量 表达 式 ， 是 指 setbuf 函数 使 用 的 缓冲 的 大 小 ; 
EOF 
它 展 开 为 一 个 负 的 整 值 常量 表达 式 ， 该 表达 式 由 几 个 函数 返回 来 说 明文 件 的 结束 ， 即 
一 个 流 输入 结束 了 : 
FOPEN MAX 
它 展 开 为 一 个 整 值 常量 表达 式 ， 表 示 实 现 支持 的 可 以 同时 打开 的 文件 数目 的 最 小 。 
FILENAME MAX 
它 展开 为 一 个 整 值 常量 表达 式 ， 表 示 一 个 char 类 型 数组 的 大 小 ， 这 个 数组 可 以 保存 
实现 可 以 打开 的 最 长 的 文件 名 串 "。 
L tmpnam 
它 展开 为 一 个 整 值 常 量 表 达 式 ， 表 示 一 个 char 类 型 数组 的 大 小 ， 这 个 数组 可 以 保存 
tmpnam 函数 生成 的 临时 文件 名 串 。 
SEEK_CUR 


SEEK END 
SEEK SET 


它们 展开 为 具有 不 同 值 的 整 值 常量 表达 式 ， 适 合作 为 fseek 函数 的 第 三 个 参数 使 用 ， 
TMP MAX 


它 展 开 为 一 个 整 值 常量 表达 式 ， 表 示 tmpnam 画 数 可 以 生成 的 单独 文件 名 的 最 小 数目 。 


stderr 
stdin 
stdout 


它们 是 “指向 FILE 的 指针 ”类 型 的 表达 式 ， 分 别 指向 与 标准 错误 流 、 标 准 输入 流 和 
标准 输出 流 相 关 的 FILE 对象。 


参见 : 文件 (7.9.3), MÅ fseek (7.9.9.2)、 流 (7.9.2) 和 函数 tmpnam (7.9.4.4). 


<stdio.h> 


文本 流 


二 进 制 流 


打开 文件 


缓冲 文件 


关闭 文件 


再 次 打开 文件 


7.9.2 流 

不 管 是 读 出 还 是 写 人 物理 设备 ， 例 如 终端 和 磁带 驱动 器 ， 或 者 不 管 是 读 出 还 是 写 人 到 
结构 化 存储 设备 支持 的 文件 ， 输 入 和 输出 都 和 逻辑 数据 流 相对 应 ， 这 些 逻 辑 数据 流 的 属性 
比 各 种 各 样 的 输入 输出 更 加 统一 。C 语言 支持 两 种 形式 的 映射 ， 文 本 流 和 二 进 制 流 "1"。 

文本 流 是 组 成 文本 行 的 有 序 字 符 序列 ， 每 一 行 都 由 零 个 或 者 多 个 字符 加 上 一 个 标志 结 
东 的 换行 符 组 成 。 最 后 一 行 是 否 需 要 结束 的 换行 符 是 由 实现 定义 的 。 输 入 输出 时 可 能 必须 
添加 、 修 改 或 者 删除 一 些 字 符 来 和 宿主 环境 中 表示 文本 的 不 同 约定 一 致 。 央 此 ， 流 中 的 字 
符 各 外 部 表示 的 字符 之 间 不 必 有 一 对 一 的 对 应 关系 。 只 有 当 数 据 仅 由 可 打印 人 字符、 控制 字 
符 水 平 制 表 符 和 换行 符 组 成 ， 紧 靠 换行 符 前 面 没 有 空格 ， 并 且 最 后 一 个 字符 是 换行 符 时 ， 
从 文本 流 中 读 出 的 数据 才 有 必要 和 前 面 写 人 到 该 流 中 的 数据 一 致 。 换 行 符 正 前 面 的 空格 在 
读 取 的 时 候 是 否 出 现 是 由 实现 定义 的 。 

二 进 制 流 是 字符 的 有 序 序列 ， 它 可 以 透明 地 记录 内 部 数据 。 在 相同 的 实现 下 ， 从 - -个 
二 进 制 流 读 入 的 数据 应 该 和 之 前 她 人 到 这 个 流 的 数据 相同 。 然 而 ， 这 样 的 流 可 能 会 有 一 定 
数 旦 的 空 字符 附加 在 流 的 结束 处 ， 具 体 数 日 由 实现 定义 。 

环境 限制 

实现 支持 的 文本 文件 的 每 一 行 应 该 至 少 可 以 包含 254 个 字符 ， 包 括 结束 的 换行 符 。 宏 
BUFSIZ 的 值 至 少 应 该 为 256。 


7.9.3 文件 

一 个 流通 过 打开 一 个 文件 来 关联 一 个 外 部 文件 〈 也 可 以 是 一 个 物理 设备 )， 也 可 能 涉 
及 打开 一 个 新 的 文件 。 创建 一 个 现 有 的 文件 会 入 弃 这 个 文件 以 前 的 内 容 。 如 果 文 件 文 持 定 
位 要 求 〈 例 如 一 个 磁盘 文件 ， 和 终端 相对 )， 那 么 和 流 相 关 的 文件 定位 符 ”就 定位 在 文件 
的 起 始 位 置 〈 零 号 字符 处 )， 除 非 文件 用 附加 模式 打开 ， 这 种 模式 下 定位 符 的 初始 化 在 文 
件 的 起 始 位 置 还 是 结束 位 置 是 由 实现 定义 的 。 文 件 定位 符 通 过 后 来 的 读 、 写 和 定位 要 求 得 
到 维护 ， 这 样 有 助 于 文件 的 顺序 行进 。 所 有 的 输入 都 像 是 通过 对 函数 fgetc 的 连续 调用 来 
读 取 ， 所 有 的 输出 都 像 是 通过 对 函数 fputc 的 连续 调用 来 写 人 。 

除了 7.9.5.3 中 定义 的 那些 ， 二 进 制 文件 不 会 被 截 得 。 对 一 个 文本 流 进行 写 操作 是 否 会 
导致 相关 文件 中 超出 操作 点 的 内 容 被 删除 是 由 实现 定义 的 。 

当 一 个 流 无 缓冲 时 ， 字 符 很 快 从 字符 源 或 者 在 目标 设备 处 出 现 。 和 否则 ， 字 符 就 会 累 
积 然后 作为 一 个 块 被 传送 到 宿主 环境 或 从 宿主 环境 移出 。 当 流 为 完全 缓冲 旦 缓冲 区 被 填 满 
时 ， 字 符 就 会 作为 一 个 块 传送 到 宿主 环境 或 者 从 宿主 环境 中 移出 。 当 一 个 流 是 行 缓冲 时 ， 
遇 到 换行 符 时 字符 就 会 作为 一 个 块 传送 到 或 者 移出 宿主 环境 。 而 且 ， 当 缓冲 区 被 坛 满 时 ， 
且 当 请 求 对 无 缓冲 的 流 输入 或 者 当 请 求 邓 需要 从 宿主 环境 传递 字符 的 行 缓冲 的 流 输 人 时 ， 
字符 就 要 作为 一 个 块 传送 到 宿主 环境 中 。 对 这 些 属 性 的 支持 是 由 实现 定义 的 ， 而 且 可 能 会 
AIRE setbuf 和 setvbuf 的 影响 。 

一 个 文件 可 以 通过 关闭 文件 来 和 控制 流 分 开 。 输 出 流 在 流 和 文件 分 离 之 前 被 清空 《〈 任 
何 没有 写 出 的 缓冲 内 容 都 被 传送 到 和 窒 主 环境 )。 在 相关 的 文件 关闭 之 后 (包括 标准 文本 
流 )， 指 向 FILE 对 象 的 指针 的 值 是 不 确定 的 。 长 度 为 零 的 文件 《〈 输 出 流 没 有 问 这 个 文件 写 
人 任何 内 容 ) 是 否 存在 是 由 实现 定义 的 。 

文件 以 后 可 以 被 再 次 打开 ， 被 同 - -个 或 者 另 一 个 程序 打开 均 可 ， 它 的 内 容 也 可 以 被 使 用 
和 修改 〈 如 果 能 重新 定位 到 它 的 起 始 位 置 的 话 )。 如 果 main 天数 返回 它 的 原始 调用 者 ， 或 者 
调用 了 exit 函数 ， 那 么 在 程序 结束 之 前 所 有 打开 的 文件 就 都 关闭 了 因此 所 有 的 输出 流 都 
被 清空 了 )。 程 序 终止 的 其 他 方法 ， 例 如 调用 abort 函数 ， 就 不 需要 正确 关闭 所 有 的 文件 。 

用 来 控制 流 的 FILE 对 象 的 地 址 可 能 会 很 重要 。 不 必 使 用 FILE 对 铺 的 副本 来 代替 原 
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tmpfile 


始 的 对 象 进行 服务 。 

程序 开始 执行 时 已 经 预定 义 了 3 个 文本 流 ， 它 们 不 需要 显示 打开 一 一 标准 输入 〔 读 人 人 常 
规 的 输入 )、 标 准 输出 《〈 写 出 常规 的 输出 ) 和 标准 错误 〈 写 出 诊断 信息 )。 标 准 错误 流 打开 的 时 
候 没有 被 完全 缓冲 ; 当 且 仅 当 流 不 会 涉及 交互 式 设 备 时 ， 标 准 输入 和 输出 流 才 被 完全 地 缓冲 。 

打开 其 他 文件 〈 非 临时 的 ) 的 函数 需要 一 个 文件 名 ， 这 个 名 字 是 一 个 串 。 构 成 有 效 的 
文件 名 的 规则 是 由 实现 定义 的 。 同 一 个 文件 能 和 否 被 同时 打开 多 次 也 是 由 实现 定义 的 。 

环境 限制 

宏 FOPEN MAX 的 值 至 少 是 8， 包括 3 个 标准 文本 流 。 

参见 : 图 数 exit (7.1043), MÅ fgetc (7.9.7.1), PÅ fopen (7.9.5.3). PR 
fputc (7.9.7.3). PAR setbuf (7.9.5.5) 和 函数 setvbuf (7.9.5.6). 


7.9.4 对 文件 的 操作 
7.9.4.1 函数 remove 
概述 


Kinclude «stdio.h» 
int remove(const char *filename); 


说 明 

函数 remove 会 导致 一 个 文件 再 也 不 能 通过 它 的 文件 名 进行 访问 ， 这 个 文件 的 文件 名 
是 由 filename 指向 的 串 。 后 面 通过 该 文件 名 来 打开 这 个 文件 的 尝试 就 会 失败 ， 除 非 它 被 
重新 创建 。 如 果 要 删除 的 文件 已 经 打开 了 ，remove 珊 数 的 行为 是 由 实现 定义 的 。 

返回 值 

PRA remove 在 操作 成 功 的 时 候 返 回 零 ， 和 否则 返回 非 零 。 
7.9.4.2 函数 rename 

概述 


#include <stdio.h> 
int rename(const char *old, const char *new); 


说 明 

函数 rename 把 名 字 为 ola 指向 的 串 的 文件 改名 为 new 指向 的 串 ， 这 个 文件 再 也 不 能 
通过 以 前 的 名 字 进 行 访问 。 如 果 调 用 吗 数 之 前 存在 一 个 名 为 new 指向 的 串 的 文件 ， 琐 数 的 
行为 是 由 实现 定义 的 。 

返回 值 

RER, PRB rename 返回 零 ， 失败 “， 则 返回 非 零 。 在 新 名 字 的 文件 存在 的 
情况 下 ， 这 个 文件 的 名 字 仍 然 是 原始 的 名 字 。 
7.9.4.3 函数 tmpfile 

概述 


#include «stdio. h> 
FILE *tmpfile(void); 


说 明 

e HU tmpfile 创建 一 个 临时 的 二 进 制 文件 ， 当 这 个 文件 关闭 或 者 程序 终止 的 时 候 
它 会 被 自动 地 移 除 。 如 果 程 序 异常 终止 ， 打 开 的 临时 文件 是 否 被 移 除 是 由 实现 定 
义 的 。 这 个 文件 打开 时 通过 模式 "wot" 进行 更 新 。 

返回 值 

函数 tmpfile 返回 一 个 指向 它 创 建 的 文件 流 的 指 链 。 如 果 不 能 创建 文件 ， 消 数 返回 一 

个 空 指针 。 
STN: BR fopen (7.9.5.3). 
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概述 
#include <stdio.h> 
char *tmpnam(char *s); 
说 明 
函数 tmpnam 生成 一 个 字符 ， 这 个 字符 是 一 个 有 效 的 文件 名 ， 并 且 它 不 和 现 有 的 文件 
名 相同 。 
FE JÅ A AA tmpnam 一 次 ， 它 就 生成 一 个 不 同 的 名 字 ， 最 多 可 以 调用 mp MAX 次 。 如 
果 调 用 的 次 数 超过 了 TMP_MAX 次 ， 消 数 行为 是 由 实现 定义 的 。 
Sk UNL (ELE FE PET RF PR tmpnam。 
返回 值 
WWRE BE PS HEEL, PA tmpnam 把 它 的 结果 保留 在 一 个 内 部 静态 对 象 中 ， 并 返 
回 指 向 该 对 象 的 指针 。 对 tmpnam 质数 的 后 续 调 用 可 能 会 修改 该 对 象 。 如 果 参 数 不 是 一 个 
空 指针 ， 就 认为 它 指向 一 个 至 少 有 L tmpnan 个 字符 元 素 的 数组 ， 函 数 tmpnam 把 结果 写 到 
该 数组 中 并 返回 参数 值 。 
环境 限制 
宏 TMP MAX 的 值 至 少 为 25. 


7.9.5 文件 访问 函数 


7.9.5.1 函数 fclose 
概述 


#include <stdio.h> 
int fclose(FILE *stream); 


说 明 

函数 fclose 使 stream 指向 的 流 被 清空 ， 并 且 和 流 相 关联 的 文件 被 关闭 。 这 个 流 中 任 
何 未 写 出 的 缓冲 数据 都 传递 到 宿主 环境 中 ， 然 后 写 人 文件 中 : 任何 未 读 出 的 缓冲 数据 都 被 
丢弃 。 流 和 文件 之 间 的 关联 也 被 解除 。 如 果 相关 的 缓冲 是 自动 分 配 的 ， 就 把 它 释放 。 

返回 值 

如 果 流 被 成 功 关闭 ， 消 数 fclose 返回 零 ， 如 果 检 测 到 任何 错误 ， 就 返回 EOF. 
7.9.5.2 MÅ fflush 

概述 


#include «stdio.h» 
int fflush(FILE *stream); 


说 明 

如 果 stream 指向 一 个 输出 流 或 者 修改 流 ， 在 这 个 流 中 ， 最 近 的 操作 不 是 输入 ， 函 数 
fflush 会 导致 这 个 流 所 有 未 写 人 的 数据 传递 给 宿主 环境 ， 然 后 写 人 文件 ， 和 否则， 函数 的 
行为 是 未 定义 的 。 

如 果 stream 是 空 指针 ， 函 数 fflush 对 所 有 的 流 执行 上 述 定义 的 清空 行为 。 

返回 值 

WR EIA PR, PUR fflush 返回 pos, WM, BAS. 

参见 : RR fopen (7.9.5.3) 和 函数 ungetc (7.9.7.11). 
7.9.5.3 函数 fopen 

概述 


#include <stdio.h> 
FILE *fopen(const char *filename, const char *mode) ; 


freopen 
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说 明 
RT fopen 打开 名 字 为 filename 指向 的 串 的 文件 ， 并 把 这 个 文件 和 一 个 流 相关 联 。 
参数 mode 指向 以 下 面 列 出 的 字符 开头 的 字符 串 I, 


r 打开 现 有 文本 文件 以 便 读 取 。 

w 生成 新 文本 文件 或 截 短 现 有 文本 文件 至 零 长 度 以 便 写 人 。 

a 附加 。 生 成 新 文本 文件 或 打开 现 有 文本 文件 以 便 在 文件 结束 处 写 人 。 
rb 打开 现 有 二 进 制 文件 以 便 读 取 。 

wb 生成 新 二 进 制 文件 或 将 现 有 二 进 制 文件 截至 零 长 度 以 便 写 人 。 

ab 附加 。 生 成 新 二 进 制 文件 或 打开 现 有 二 进 制 文件 以 便 在 文件 结束 处 写 人 。 
r+ 打开 现 有 文本 文件 ， 以 便 更 新 〈 读 和 写 )。 

w+ 生成 新 文本 文件 或 将 现 有 文件 截至 零 长 度 以 便 更 新 。 

a+ 附加 。 生 成 新 文本 文件 或 打开 现 有 文件 以 便 更 新 ， 在 文件 结束 处 写 人 。 


r«bmrbe 打开 现 有 二 进 制 文件 以 便 更 新 〈 读 和 写 )。 

wtb ak wot ”生成 新 二 进 制 文件 或 截 短 现 有 文件 至 零 长 度 以 便 更 新 。 

atbakab+ ”附加 。 生 成 新 二 进 制 文件 或 截 短 现 有 文件 至 零 长 度 以 便 更 新 ， 在 文件 

结束 处 写 人 。 

HERR Cir 作为 mode 参数 的 第 一 个 字符 ) 打开 一 个 文件 时 ， 如 果 文 件 不 存在 或 者 
不 能 读 ， 操 作 就 会 失败 。 

用 附加 模式 〈'a' 作为 mode 参数 的 第 一 个 字符 ) 打开 一 个 文件 会 使 后 面 所 有 对 文件 的 
写 操作 都 强制 到 当前 的 文件 结束 处 ， 不 管 中 间 是 否 调用 了 冰 数 fseek。 在 某 些 实现 下 ， 用 
附加 模式 ('b' 作为 以 上 mode 参数 值 列 表 的 第 二 个 或 者 第 三 个 参数 ) 打开 一 个 二 进 制 文件 
可 能 会 把 流 的 文件 定位 符 放 置 到 超过 写 人 的 最 后 一 个 数据 的 地 方 ， 因 为 存在 空 字 符 填 充 。 

当 一 个 文件 用 更 新 模式 Che 作为 以 上 mode 参数 列表 的 第 二 个 或 者 第 三 个 字符 ) AT 
开 时 ， 对 相关 的 流 可 以 执行 输入 和 输出 操作 。 然 而 ， 如 果 中 间 没 有 调用 函数 ftlush 或 者 
文件 定位 函数 (fseek, fsetpos 或 者 rewind)， 输 出 可 能 不 会 直接 跟 在 输入 后 面 :， 如 果 中 
间 没 有 调用 文件 定位 函数 ， 输 入 也 可 能 不 会 直接 跟 在 输出 后 面 ， 除 非 输入 操作 恰好 发 生 在 
文件 结束 处 。 在 某 些 实现 下 ， 用 更 新 模式 打开 (或 者 创建 ) 一 个 文本 文件 可 能 会 代替 打开 
(或 者 创建 ) 一 个 二 进 制 流 。 

当 一 个 流 打 开 时 ， 当 且 仅 当 可 以 确定 这 个 流 不 会 涉及 一 个 交互 式 设备 时 ， 它 才 可 以 完 
全 缓冲 。 该 流 的 错误 指示 符 和 文件 结束 符 会 被 清除 。 

返回 值 

函数 fopen 返回 指向 控制 流 的 对 象 的 指针 。 如 果 打 开 操作 失败 ，ftopen 返回 空 指针 。 

参见 : 文件 定位 函数 (79.9). 
7.9.5.4 Hi freopen 

概述 


*include «stdio.h» 
FILE *freopen(const char *filename, const char *mode, 
` FILE *stream); 


说 明 

函数 frecpen 打开 名 字 为 filename 指向 的 串 的 文件 ， 并 且 把 它 和 stream 指向 的 流 
关联 在 一 起 。 对 mode 参数 的 使 用 与 函数 fopen 中 的 相同 ““。 

函数 freopen 首先 尝试 关闭 和 指定 的 流 关 联 的 任意 文件 。 如 果 不 能 成 功 关 闭 ， 就 忽略 
这 一 点 。 然 后 清空 流 的 错误 指示 符 和 文件 结束 符 。 

返回 值 

如 果 打 开 文 件 操作 和 失败， 函数 freopen 就 返回 一 个 空 指针 ; 否则 freopen 返回 
stream 的 值 。 


<stdio.h> 
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7.9.5.5 函数 setbuf 
概述 


finclude <stdio.h> 
void setbuf (FILE *stream, char *buf); 


说 明 
”除了 没有 返回 值 之 外 ， 函 数 setbuf 就 等 价 于 函数 setvbuf， 而 该 函数 是 以 参数 mode 

为 IOFBF 的 值 和 参数 size 为 BUFSIZ 的 值 被 调用 的 ， 或 者 〈 如 果 buf 是 一 个 空 指针 ) 是 
以 参数 mode 为 _IONBF 的 值 被 调用 的 。 

返回 值 

PA setbuf 没有 返回 值 。 

参见 : mU setvbuf (7.9.5.6). 
7.9.5.6 函数 setvbuf 

概述 


#include <stdio.h> 
int setvbuf (FILE *stream, char *buf, int mode, 
size_t size); 


说 明 

PRA setvbuf 只 能 在 stream 指向 的 流 和 一 个 打开 文件 相关 联 之 后 ， 并 且 还 没有 对 流 
执行 任何 其 他 操作 之 前 使 用 。 参 数 mode 决定 stream 缓冲 的 方式 ， 具 体 如 下 : IOFBF Sg 
致 输入 /输出 完全 缓冲 ，_IOLBF 导致 输入 /输出 行 缓冲 ，._IONBF 导致 输入 /输出 不 缓冲 。 
如 果 buf 不 是 一 个 空 指针 ， 可 以 使 用 它 指向 的 数组 来 代替 setvbuf 函数 分 配 的 缓冲 区 UU, 
size 指定 了 数组 的 大 小 ， 数 组 的 内 容 在 任何 时 候 都 是 不 确定 的 。 

返回 值 

PAR setvbuf 成 功 时 返回 零 ， 如 果 赋 子 参数 mode 一 个 无 效 的 值 或 者 请 求 没 有 被 响应 ， 
就 返回 非 零 。 
7.9.6 格式 化 的 输入 输出 函数 
7.9.6.1 函数 fprintf 

概述 


#include «stdio.h» 
int fprintf(FILE *stream, const char *format, ... ); 


说 明 
函数 fprintf 在 format 指向 的 串 的 控制 下 把 输出 写 入 stream 指向 的 流 ，format få 
向 的 串 指 定 了 输出 时 转换 的 后 续 参 数 的 格式 。 如 果 格 式 的 参数 不 够 ， 那 么 这 种 行为 未 定义 。 
如 果 格 式 用 完了 而 参数 有 剩余 ， 那 么 〈 通 常 ) 也 处 理 多 余 的 参数 ， 否 则 ， 就 忽略 它们 。 当 
遇 到 格式 串 的 结尾 时 ， 郴 数 fprintf 返回 。 
格式 应 该 是 一 个 多 字 节 字符 序列 ， 以 它 的 初始 的 转移 状态 开始 和 结束 。 格 式 由 一 条 或 者 
多 条 指示 组 成 ， 普 通 的 多 字 节 字符 (% 除外 )， 它 们 原封 不 动 地 被 复制 到 输出 流 ， 转 换 说 明 ， 
每 个 转换 说 明 都 会 产生 零 个 或 者 多 个 后 续 的 参数 。 它 以 F, $ 后 面 依次 出 现 以 下 元 素 : 
e 零 个 或 者 多 个 标志 字符 (以 任意 顺序 )， 修 改 转换 说 明 的 含义 。 
e 订 选 最 小 字段 宽度 。 如 果 转 换 值 的 宽度 比 字 段 宽 度 小 ， 那 么 就 在 字段 的 左边 ( 如 
果 给 定 了 左 调整 标志 ， 或 者 右边 ， 下 面 会 描述 ) 填充 空格 〈 默 认 )。 字 段 宽度 是 一 
个 星 号 *〈 后 面 会 描述 ) 的 形式 或 者 是 一 个 十 进 制 整数 "TS, 
e 可 选 的 精度 说 明 ， 它 给 出 了 da、i、o、u、x 和 X 转 换 中 出 现 的 数字 的 最 少 个 数 ; 
e、 己 与 上 转换 的 小 数 点 右边 的 位 数 ，g 与 6 转换 的 最 大 有 效 位 数 ，s 转换 中 要 从 
字符 串 写 人 的 最 大 字符 数 。 精 度 说 明 的 形式 是 小 数 点 后 面 跟 一 个 星 号 或 者 一 个 可 
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选 的 十 进 制 整数 。 只 有 指定 了 句点 的 时 候 ， 采 用 的 精度 才 是 零 。 如 果 精 度 以 其 他 
转换 说 明 符 的 形式 出 现 ， 则 这 种 行为 未 定义 。 

e 可 选 的 字母 h 用 于 转换 操作 a、i、o、u、x 或 X， 表 示 转 换 参 数 的 类 十 为 short 
int RH unsigned short int。( 参 数 可 能 根据 整 值 提升 规则 进行 了 提升 ， 它 的 
值 在 打印 之 前 应 该 转换 为 short int 或 者 unsigned short int.) 字符 h 用 于 n 
转换 时 ， 表 示 转 换 参 数 的 类 型 是 short int*。 一 个 可 选 的 字母 1 用 于 转换 操作 
d, i, o u, x 与 X 时 ， 表 示 转 换 参 数 类 型 为 long int SE unsigned long int: 
用 于 转换 时 ， 表 示 转 换 参 数 的 类 型 为 long int*。 可 选 的 字母 L 用 于 转换 操作 
e、E、f、 或 g 与 G6， 表示 转换 参数 的 类 型 为 long double, WR h、1 或 者 工 跟 
其 他 的 转换 说 明 符 一 起 出 现 ， 则 这 种 行为 未 定义 。 

€ 指定 要 使 用 的 转换 类 型 的 字符 。 

像 上 面 说 明 的 那样 ， 最 小 字段 宽度 或 者 精度 ， 或 者 它们 两 个 可 以 简化 为 一 个 星 号 。 这 
种 情况 下 ， 一 个 int 参数 提供 了 字段 宽度 或 者 精度 。 指 定 字段 宽度 或 者 精度 或 者 它们 两 个 
的 参数 ， 应 该 顺序 出 现在 所 有 要 转换 的 参数 之 前 。 负 的 字段 宽度 参数 表示 为 一 个 "-" 标志 
后 面 跟 一 个 正 的 字段 宽度 。 负 的 精度 参数 被 当 作 没有 精度 说 明 对 待 。 

标志 字符 和 它们 的 意思 如 下 。 

- 左 对 齐 字段 宽度 中 的 值 。〈 如 果 没 有 使 用 这 个 标志 字符 ， 则 是 右 对 齐 。) 

+ 带 符号 转换 的 结果 总 是 以 一 个 + 或 -符号 开始 .没有 指定 这 个 标志 时 ， 只 有 
负 值 被 转换 时 前 面 才 带 符号 。 

空格 ”如果 一 个 带 符号 转换 的 结果 中 第 一 个 字符 不 是 符号 或 者 转换 的 结果 没有 任何 字符 ， 
就 在 结果 前 加 一 个 空格 。 如 果 同 时 出 现 了 空格 和 + 标志 ， 空 格 标志 将 被 忽略 。 

$ 如 果 有 # 标志， 结果 被 转换 为 一 个 “替换 形式 ”。 MOR, BERGER ANG 
度 来 使 结果 的 第 一 个 数字 为 零 。 对 x MAX 转换 ， 一 个 非 零 结果 的 前 绥 是 
Ox (或 者 0X)。 对 e. E. f. a 和 6 转换， 即使 小 数 点 后 面 没 有 数 ， 结 果 也 要 包 
含 一 个 小 数 点 。 对 g AG 转换 来 说 ， 尾 部 的 零 不 从 结果 中 删除 。 对 其 他 的 转换 
便 用 # 标志 ， 则 行为 是 未 定义 的 。 

0 fed, i, o. u, x X、e、E、f、g 和 G 转 换 中 ， 使 用 0 后面 跟 符 号 或 者 基数 
指示 符 ) 作为 填充 字符 。 不 执行 空格 填充 。 如 果 0 标志 和 一 标志 同时 出 现 ， 则 
忽略 0 标志 。 对 d、i、o、u、x 和 X 转 换 来 说 ， 如 果 指 定 了 精度 ， 则 忽略 0 标 
志 。 对 其 他 的 转换 使 用 0 标志 ， 则 行为 是 未 定义 的 。 

转换 说 明 符 和 它们 的 含义 如 下 。 

d, i int 参数 转换 为 带 符号 的 十 进 制 数 ， 形 式 为 [-Jdddd。 精 度 指 定 了 显示 数字 的 最 
小 数目 ， 如 果 转 换 的 值 可 以 用 更 少 的 数字 表示 ， 则 前 面 用 零 填 充 。 默 认 的 精度 
是 1。 把 零 值 用 精度 零 转 换 ， 结 果 没 有 任何 字符 。 

o. u, x, X unsigned int 参数 转换 成 无 符号 八进制 数 〈o)、 无 符号 十 进 制 数 Co) 或 者 
无 符号 十 六 进 制 数 (x 或 者 X)， 形 式 为 dddd。x 转换 使 用 字母 abcdef, x 转换 使 
用 字母 ABcDEF。 精 度 指 定 了 显示 数字 的 最 小 数目 ， 如 果 转 换 的 值 可 以 用 更 少 的 数 
字 表 示 ， 则 前 面 用 零 填 充 。 默 认 的 精度 是 1。 把 零 值 用 精度 零 转 换 ， 结 果 没 有 任何 

f double 参数 转换 为 十 进 制 数 ， 形 式 为 -1did add， 这 里 小 数 点 字符 后 面 的 位 数 
和 精度 说 明 符 相 等 。 如 果 不 说 明 精 度 ， 则 默认 为 6。 如 果 精 度 为 零 并 上 且 没有 使 
用 # 标 志 ， 则 不 会 出 现 小 数 点 字符 。 如 果 出 现 了 一 个 小 数 点 ， 则 它 的 前 面 至 少 
有 一 个 数字 。 结 果 值 为 伟人 到 适当 位 数 的 数字 。 

e, E double 参数 转换 为 十 进 制 数 ， 形 式 为 [-Jqd.ddde 十 dd， 这 里 ， 小 数 点 前 面 至 少 
要 有 一 个 数字 〈 如 果 参 数 非 零 ， 这 个 数字 也 非 零 )， 小 数 点 后 面 的 位 数 和 精度 
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相等 。 如 果 不 说 明 精 度 ， 则 默认 为 6。 如 果 精 度 为 零 并 且 没 有 使 用 # 标志 ， 则 
不 会 出 现 小 数 点 字符 。 结 果 值 为 舍 入 到 适当 位 数 的 数字 。E 转换 说 明 符 用 E 产 生 
一 个 数 来 代替 产生 指数 的 e。 指 数 通 常 至 少 包含 两 位 。 如 果 值 为 零 ， 指 数 就 是 零 。 
g, G double 参数 转换 为 和 £ 或 e( 对 6G 转换 来 说 是 E) 相同 的 样式 ， 只 不 过 精度 指定 
的 是 有 效 数字 的 数目 。 如 果 精 度 是 0， 就 把 它 当 作 1。 使 用 的 样式 由 转换 的 值 决定 ， 
只 有 转换 产生 的 结果 的 指数 小 于 -4 或 者 不 小 于 精度 的 时 候 才 使 用 e (RAE) FF 
式 。 删 除 结果 小 数 部 分 尾部 的 零 ， 只 有 小 数 点 后 面 有 数字 的 时 候 才 显示 小 数 点 。 
c int 参数 转换 为 unsigned char 类 型 ， 并 且 写 出 结果 。 
s 参数 应 该 是 指向 字符 类 型 “ 数组 的 指针 。 写 出 字符 数组 中 结束 的 空 字符 之 前 的 
所 有 字符 ， 如 果 指 定 了 精度 ， 则 最 多 写 出 精度 数目 的 字符 。 如 果 没 有 指定 精度 
或 者 精度 比 数组 的 元 素 个 数 大 ， 那 么 数组 应 该 包含 一 个 空 字符 。 
p ”参数 应 该 是 指向 void 的 指针 。 参 数 的 值 按照 实现 定义 的 方式 转换 成 一 个 可 打印 
字符 的 序列 。 
n 参数 是 一 个 指向 整 型 变量 的 指针 ， 这 个 整 型 变量 记录 了 到 目前 为 止 通过 调用 
fprintf 所 写 到 输出 流 的 字符 的 总 数 。 不 转换 参数 。 
% 写 出 一 个 %， 不 转换 参数 。 完 整 的 转换 说 明 是 %%。 
如 果 一 个 转换 说 明 是 无 效 的 ， 则 行为 是 未 定义 的 。 
如 果 一 个 参数 是 ， 或 者 指向 一 个 联合 或 者 一 个 集合 ‘除了 使 用 %s 转换 的 字符 数组 ， 
或 者 使 用 sp 转换 的 指针 )， 则 行为 是 未 定义 的 。 
任何 情况 下 ， 一 个 不 存在 的 字段 宽度 或 者 很 小 的 字段 宽度 都 不 会 导致 字段 的 截 短 。 如 
果 转 换 结果 比 字段 宽度 长 ， 那 么 就 扩展 字段 来 包含 转换 结果 。 
返回 值 
函数 fprintf 返回 传送 的 字符 的 数目 ， 如 果 发 生 了 输出 错误 ， 就 返回 一 个 负 值 。 
环境 限制 
一 次 转换 产生 的 字符 的 最 大 数目 最 少 应 该 是 509。 
例子 
下 面 的 例子 按照 “Sunday，July 3，10:02” 的 形式 打印 日 期 和 时 间 ， 后 面 是 保留 5 位 
小 数 的 x 值 
#include <math.h> 
#include <stdio.h> 
(ff 
char *weekday, *month; /* pointers to strings */ 
int day, hour, min; 
fprintf(stdout, "$s, $s %d, $.2d:$.2dWn", 


weekday, month, day, hour, min); 
fprintf(stdout, "pi = %.5f\n*, 4*atan(1.0)); 


7.9.6.2 函数 fscanf 
概述 


#include <stdio.h> 
int fscanf(FILE *stream, const char *format, ...); 


说 明 

函数 ftscanf 在 format 指向 的 串 的 控制 下 ， 使 用 后 面 的 参数 作为 指向 接收 转换 后 的 输 
人 的 对 象 的 指针 。 从 stream 指向 的 流 中 读 取 输 入 。format 指向 的 串 指定 了 可 接收 的 输入 
序列 和 对 它们 进行 转换 以 便 赋 值 的 方式 。 如 果 格 式 的 参数 不 够 ， 则 行为 是 未 定义 的 。 如 果 
格式 用 完了 而 参数 有 剩余 ， 那 么 〈 通 常 ) 也 处 理 多 余 的 参数 :否则 ， 就 忽略 它们 。 

格式 应 该 是 一 个 多 字 节 字符 序列 ， 以 它 的 初始 化 的 转移 状态 开始 和 结束 。 格 式 由 零 个 
或 者 多 个 指示 性 语句 组 成 : 一 个 或 者 多 个 空白 字符 ， 一 个 普通 的 多 字 节 字符 〈 不 是 # 和 空 
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白字 符 )， 或 者 一 个 转换 说 明 。 
每 一 个 转换 说 明 都 由 字符 ss 引入， 在 # 后 面 按 顺 序 山 现下 面 的 元 素 。 
。 可 选 的 赋值 取消 字符 *。 
e 可 选 的 非 零 十 进 制 整数 ， 用 来 指定 最 大 的 字段 宽度 。 
e 可 选 字符 h、1 (ell) 或 者 L， 用 来 说 明 接 收 对 象 的 大 小 。 如 果 一 个 参数 是 指向 
short int 而 不 是 int 的 指针 ， 则 nm 应 该 写 在 相应 的 转换 说 明 符 da. inc 
前 ; 或 者 如 果 是 指向 long int 的 指针 ， 则 1 写 在 之 前 。 同 理 ， 如 果 参 数 是 指向 
unsigned short int 而 不 是 unsigned int 的 指针 ， 则 hh 应 该 写 在 转换 说 明 符 o, 
u 和 x 之 前 ; 或 者 如 果 是 unsigned long int, JM 1 写 在 之 前 。 最 后 ， 如 果 参 数 
是 指向 double 而 不 是 float 的 指针 ， 则 1 应 该 写 在 转换 说 明 符 e、f 和 g 之 前 ; 
或 者 如 果 是 long double， 则 工 写 在 之 前 。 如 果 h、1 或 者 工 和 其 他 转换 说 明 符 出 
现在 一 起 ， 则 行为 是 未 定义 的 。 
。 一 个 字符 ， 这 个 字符 指定 了 待 用 的 转换 类 型 。 下 面 会 说 明 有 效 的 转换 说 明 符 。 
PAY fscanf 依次 执行 格式 中 的 每 条 指示 。 如 果 一 个 指示 失败 了 ， 就 像 下 面 描述 的 细 
FARE, H fscanf 就 返回 。 失 败 是 指 输 入 失败 〈 因 为 一 个 不 可 用 的 输入 字符 ) 或 者 匹 
配 失败 《因为 不 适当 的 输入 )。 
由 任意 个 空 字符 组 成 的 指示 通过 读 取 输入 来 执行 ， 直 到 遇 到 第 一 个 非 空白 字符 〈 不 对 
它 进 行 读 取 )， 或 者 直到 再 也 没有 字符 可 以 读 取 。 
一 个 普通 的 多 字 节 字符 指示 读 取 流 的 下 一 个 字符 。 如 果 一 个 字符 和 组 成 控制 语句 的 字 
符 不 同 ， 则 指示 失败 ， 不 同 的 字符 和 它 后 面 的 字符 都 不 能 被 读 取 。 
一 个 转换 说 明 符 指示 定义 了 匹配 输入 序列 的 一 个 集合 ， 下 面 详细 描述 了 每 一 个 说 明 
符 。 转 换 说 明 符 按照 以 下 的 步骤 执行 : 
跳 过 输入 的 空白 字符 (H isspace 函数 指定 )， 除 非 说 明 包含 一 个 [、c 或 者 n DATT. 
从 输入 流 中 读 取 一 个 输入 项 ， 除 非 说 明 包 含 一 个 nn 说明 符 。 一 个 输入 项 是 输入 字符 的 
最 长 的 匹配 序列 ， 除 非 它 超过 了 指定 的 字段 宽度 ， 这 种 情况 下 它 是 序列 中 前 面 的 该 长 度 个 
字符 。 如 果 输 入 项 后 面 还 有 字符 的 话 ， 后 面 的 第 一 个 字符 仍然 没有 被 读 取 。 如 果 输 入 项 的 
长 度 为 零 ， 则 指示 执行 失败 ， 这 种 情况 是 匹配 失败 ， 除 非 一 个 错误 阻止 从 流 的 输入 ， 这 种 
情况 是 输入 失败 。 
除了 一 个 $ 说 明 符 的 情况 ， 输 入 项 (或 者 在 一 个 sn 指示 的 情况 下 ， 输 入 字符 的 总 
BO 被 转换 为 和 转换 说 明 符 适应 的 类 型 。 如 果 输 入 项 不 是 一 个 匹配 的 序列 ， 指 示 的 执行 失 
We: 这 种 情况 是 一 个 匹配 失败 。 除 非 用 一 个 * 指示 一 个 赋值 取消 ， 和 否则 转换 的 结果 存储 在 
format 后 面 的 第 一 个 参数 指向 的 对 象 中 ， 这 个 对 象 还 没有 接收 到 转换 的 结果 。 如 果 这 个 对 
象 没 有 合适 的 类 型 ， 或 者 转换 的 结果 不 能 在 提供 的 空间 中 表示 ， 则 行为 未 定义 。 
下 面 的 转换 说 明 符 是 有 效 的 。 
d ”和 一 个 可 选 的 有 符号 十 进 制 整 数 相 匹 配 ， 这 个 整数 的 格式 和 strtol 函数 base 
参数 为 10 时 的 目标 序列 所 期 望 的 格式 相同 。 相 应 的 参数 是 一 个 指向 整数 的 指针 。 
i 和 一 个 可 选 的 有 符号 整数 相 匹配 ， 这 个 整数 的 格式 与 strtol 函数 base 参数 为 0 
时 的 目标 序列 所 期 望 的 格式 相同 。 相 应 的 参数 应 该 是 一 个 指向 整数 的 指针 。 
o ”和 一 个 可 选 的 有 符号 八进制 整数 相 匹 配 ， 这 个 整数 的 格式 和 strtoul pha base 参数 
为 8 时 的 目标 序列 所 期 望 的 格式 相同 。 相 应 的 参数 应 该 是 一 个 指向 无 符号 整数 的 指针 。 
u ”和 一 个 可 选 的 有 符号 十 进 制 整数 相 匹 配 ， 这 个 整数 的 格式 和 strtoul 函数 base 参数 为 
10 时 的 目标 序列 所 期 望 的 格式 相同 ， 相 应 的 参数 应 该 是 一 个 指向 无 符号 整数 的 指针 。 
x ”和 一 个 可 选 的 有 符 导 十 六 进 制 数 相 匹 配 ， 这 个 整数 的 格式 和 strtoul PR base NE 
数 为 16 时 的 目标 序列 所 期 望 的 格式 相同 。 相 应 的 参数 是 一 个 指向 无 符号 整数 的 指针 。 
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e f o ”和 一 个 可 选 的 有 符号 浮 点 数 匹 配 ， 该 浮 点 数 格式 和 函数 strtod 的 日 标 序列 
所 期 望 的 格式 相同 。 相 应 的 参数 是 一 个 指向 浮 点 数 的 指针 。 
s 和 一 个 非 空白 字符 己 序列 匹配 。 相 应 的 参数 应 该 是 指向 一 个 数组 的 首 字符 的 指针 ， 这 
个 数组 应 足够 大 ， 可 以 接受 该 字符 序列 和 -一个 结束 的 空 字符 ， 该 字符 会 被 自动 添加 。 
[ 和 一 个 非 空 字符 空 序列 匹配 ， 这 些 字符 都 属于 -一 个 字符 集 (扫描 集 )。 相 应 的 参 
数 应 该 是 指向 数组 的 首 字符 的 指针 ， 这 个 数组 应 足够 大 ， 可 以 接受 该 序列 和 一 个 
终止 的 空 字符 ， 该 字符 会 被 自动 添加 。 转 换 说 明 符 包括 format 串 后 面 的 所 有 字 
符 ， 直 到 匹配 的 右 括 导 (])， 而 且 包 括 这 个 括号 。 岗 个 括号 之 间 的 字符 (扫描 列 
表 ) 组 成 了 扫描 集 ， 除 非 左 括号 后 面 的 字符 是 音调 符号 (~)， 这 种 情况 下 扫 捕 集 
包含 了 音调 符号 和 右 括号 之 间 所 有 不 出 现在 扫描 列表 中 的 字符 。 如 果 转 换 说 明 符 
以 UO 或 者 UY 开头 ， 那 么 右 括号 字符 在 扫描 列表 中 ， 下 一 个 右 括号 才 是 结束 说 
明 的 匹配 的 右 括号 ， 否 则 ， 第 一 个 右 括号 就 是 终止 说 明 的 右 括号 。 如 果 “ 一 ” 字 
符 出 现在 扫描 列表 中 ， 并 且 它 不 是 第 一 个 字符 ， 也 不 是 以 ~ 为 第 个 字符 时 的 第 二 
个 字符 ， 也 不 是 最 后 一 个 字符 ， 则 行为 是 由 实现 定义 的 。 
c “和 一 个 字符 序列 匹配 ， 字 符 的 数目 由 字段 宽度 指定 〈 如 果 指示 中 没有 给 出 字段 宽 
度 ， 则 数目 为 1)。 相 应 的 参数 为 指向 一 个 数组 的 首 字符 的 指针 ， 这 个 数组 足够 
大 ， 可 以 接受 这 个 序列 ， 不 会 添加 空 字 符 。 
p ”和 一 个 实现 定义 的 序列 集合 相 匹配 ， 这 个 序列 集合 应 该 和 函数 fprintf 使 用 sn 
转换 生成 的 序列 集合 相同 。 相 应 的 参数 是 一 个 指向 void 的 指针 的 指针 。 输 入 项 
的 解释 是 由 实现 定义 的 。 如 果 输入 项 是 之 前 同一 个 程序 执行 过 程 中 转换 得 到 的 
个 值 ， 那 么 产生 的 指针 应 该 和 这 个 值 相 等 ， 否 则 ，%p 转换 的 行为 是 未 定义 的 。 
n ”不 读 取 输入 ， 相 应 的 参数 是 指向 一 个 整数 的 指针 ， 这 个 整数 记录 了 到 目前 为 止 
通过 调用 fscanf 函数 从 输入 流 读 取 的 字符 的 总 数 。 执 行 一 个 sn 指示 不 会 增加 
fscanf 消 数 执行 完成 时 返回 的 赋值 总 数 。 
% ”和 一 个 匹配 ， 不 进行 转换 或 者 赋值 。 完 整 的 转换 说 明 应 该 是 %%。 
如 果 转 换 说 明 是 无 效 的 ， 则 行为 未 定义 中 。 
转换 说 明 符 E、G 和 x 也 是 有 效 的 ， 它 们 的 行为 分 别 和 se、g 和 x 相同 。 
输入 的 时 候 如 果 遇 到 一 个 文件 结束 符 ， 转 换 就 会 终止 。 如 果 在 读 人 和 当前 指示 匹配 的 
任何 字符 之 前 出 现 了 文件 结束 符 〈 而 不 是 允许 出 现 开头 的 空白 )， 则 当前 指示 因 输入 失败 
而 终止 执行 ， 和 否则， 除非 当前 指示 以 一 个 匹配 失败 终止 执行 ， 下 一 条 指示 《如 果 有 的 话 ) 
就 因 输 入 失败 终止 执行 。 
如 果 转 换 因为 一 个 无 法 识别 的 输入 字符 而 终止 ， 那 么 这 个 输入 字符 留 在 输入 流 中 不 被 
读 取 。 尾 部 的 空白 (包括 换行 符 〉 也 留 在 输入 流 中 不 被 读 取 ， 除 非 它 和 一 个 指示 匹配 。 和 
通过 使 用 en 指示 相 比 ， 文 字 匹 配 和 取消 赋值 的 赋值 取消 标志 的 成 功 执行 不 能 被 直接 确定 。 
返回 什 
如 果 在 任何 转换 之 前 发 生 了 输入 失败 ， 函 数 fscanf 返回 宏 so mp, AM, mp 
fscanf 返回 赋值 的 输入 项 的 数目 ， 这 个 值 会 比 早 期 发 生 了 匹配 失败 时 提供 的 值 小 ， 甚 至 


有 可 能 为 0。 
例子 
以 下 代码 段 
#include <stdio.h> 
/*. 2 .*/ 


int n, i; float x; char name [50]; 
n = fscanf(stdin, "%d%f%s", &i, &X, name); 


的 输入 


25 54.32E-1 thompson 
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会 使 n 的 值 为 3，i 的 值 为 25，x ME 5.432, name 包括 thompson\0. 
以 下 程序 段 


#include <stdio.h> 

[*...*] 

int i; float x; char name[50]; 

fscanf(stdin, "%2d%f%*d %[0123456789]", Ei, &x, name); 


的 输入 


56789 0123 56a72 


会 使 i 的 值 为 56, x 的 值 为 789.0， 会 跳 过 0123, name 将 包括 56\0。 从 输入 流 读 取 的 下 
一 个 字符 将 会 是 a。 


下 面 的 代码 可 以 重复 地 从 stdin 中 接受 一 个 数量 、 一 个 测量 单元 和 一 个 项 目 名 字 :; 


#include <stdio.h> 

/[*.,..*/ 

int count; float quant; char units[21), itemf21]: 

while (!feof(stdin) && !ferror(stdin)) ( 
count = fscanf(stdin, "$f$20s of %20s", 

&quant , units, item); 

fscanf(stdin," $*[^WMn]"); 

) 

如 果 stdin 流 包含 下 面 各 行 : 

2 quarts of oil 

-12.8degrees Celsius 

lots 0f luck 

10.0LBS of 

dirt 

100ergs of energy 


则 上 面 例子 的 执行 就 和 下 面 的 赋值 语句 类 似 : 


quant 2; strepy(units, "quarts"); strepy(item, "oil"); 
count 了 

quant -12.8; strcpy(units, "degrees"); 

count 2: /* "C" fails to match "o" */ 


count = 0; /* "1" fails to match "&f" */ 


quant 10.0; strcpy (units, "LBS") ; strcpy (item, “dirt"); 
count 3; 

count 0; /* "100e" fails to match "$f" zi 

count EOF; 


SN: PRU strtod (7.10.1.4), PRÉ strtol (7.10.1.5) 和 函数 strtoul (7.10.1.6). 
printf | 7.0.6.3 函数 printf 


概述 
#include «stdio.h» 
int printf(const char *format, ...); 
" e 
函数 printf 和 fprintf 等 价 ， 只 不 过 fprintf 把 参数 stdout 插 到 了 printf 的 参数 
的 前 面 。 
返回 值 


函数 printf 返回 传送 的 字符 数 ， 发 生 输 出 错误 的 时 候 ， 就 返回 一 个 负 值 。 
scanf | 7.9.6.4 函数 scanf 
概述 


#include <stdio.h> 
int scanf(const char *format, ...); 
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sprintf 


sscanf 


vfprintf 


说 明 

图 数 scanf 和 fscanf 等 价 ， 只 不 过 fscanf 把 参数 stdin HF] scant 的 参数 之 前 。 

返回 值 

如 果 在 任何 转换 之 前 发 生 了 输入 失败 ， 函 数 scant 返回 宏 EOF MA: BM, AR 
scanf 返回 赋值 的 输入 项 的 数目 ， 这 个 值 可 能 比 早期 发 生 了 匹配 失败 的 情况 提供 的 值 小 ， 


7.9.6.5 HÅ sprintf 
概述 


#include <stdio.h> 
int sprintf(char *s, const char *format, ...); 


说 明 

RÉI sprintf 等 价 于 fprintf， 只 不 过 参数 s 指定 了 一 个 数组 ， 生 成 的 输出 写 入 到 这 
个 数组 中 ， 而 不 是 写 到 一 个 流 中 。 在 写 和 的 字符 最 后 写 人 一 个 空 字符 ， 它 不 计 人 返回 和 的 
一 部 分 。 如 果 两 个 交友 的 对 象 之 间 发 生 了 复制 ， 则 行为 未 定义 。 

返回 值 

函数 sprintf 返回 写 到 数组 中 的 字符 的 数目 ， 不 包括 终止 的 空 字符 。 
7.9.6.6 函数 sscanf 

概述 


#include <stdio.h> 
int sscanf(const char *s, const char *format, ...); 


说 明 

函数 sscanf 和 fscanf 等 价 ， 只 不 过 参数 s 指定 了 一 个 串 ， 输 入 是 从 这 个 串 中 获取 ， 
而 不 是 从 流 中 获取 。 到 达 串 的 结尾 等 价 于 函数 fscanf 遇 到 了 文件 结束 符 。 如 果 两 个 交 选 
的 对 象 之 间 发 生 了 复制 ， 则 行为 未 定义 。 

返回 值 

如 果 在 任何 转换 之 前 发 生 了 输入 错误 ， 函 数 sscanf 返回 宏 zo FE. en, PRÉ 
sscanf 返回 输入 项 赋值 的 数目 ， 这 个 值 可 能 比 早期 发 生 了 匹配 错误 的 情况 下 提供 的 值 小 ， 
甚至 可 能 为 零 。 


7.9.6.7 函数 vfprintf 
概述 


#include <stdarg.h> 
#include <stdio.h> 
int vfprintf(FILE *stream, const char *format, va_list arg); 


说 明 

函数 vfprintt FT Å fprintft， 只 不 过 可 变 参 数 表 用 arg 代替 ， 它 已 经 被 宏 
va start (可 能 后 来 还 有 va arg 调用 ) WET. AX vfprintf 不 调用 宏 va_ena'”*。 

返回 值 

PRA v£printf 返回 传送 的 字符 的 数目 ， 如 果 发 生 了 输出 错误 ， 则 返回 一 个 负 值 。 

例子 

下 而 的 例子 展示 了 常规 的 错误 报告 中 对 vfprintf 的 使 用 

#include<stdarg.h> 


#include<stdio.h> 


void error(char *function name, char *format, ... ) 
( 


va list args; 


vprintf 


vsprintf 


fgetc 


fgets 
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va start (args, format) ; 

/* print out name of function causing error */ 
fprintf(stderr, "ERROR in %s: ", function, name); 
/* print out remainder of message */ 

vfprintf (stderr, format, args) ; 

va end(args) ; 


) 
7.9.6.8 函数 vprintf 


#include «stdarg.h» 

#include <stdio.h> 

int vprintf(const char *format, va_list arg); 
说 明 


St vprintt 等 价 于 printf， 只 不 过 用 arg 代替 可 变 参 数 表 ， 它 已 经 被 宏 va start 
(可 能 后 来 还 有 va_arg 调用 ) MÅLT. BU vprintf 不 调用 宏 va end”, 

返回 值 

PR vprintt 返回 传送 的 字符 的 数目 ， 发 生 了 输出 错误 的 时 候 ， 返 回 一 个 负 值 。 
7.9.6.9 函数 vsprintf 


#include <stdarg.h> 

#include <stdio.h> 

int vsprintf(char *s, const char *format, va_list arg); 
说 明 


PÅ Å vsprintf 等 价 于 sprintf， 只 不 过 可 变 参 数 表 用 arg 代替， 它 已 经 被 宏 
va start (可 能 后 来 还 有 va_arg WHO WIET. MÆ vsprintf RARE va ena"^, 
如 果 两 个 交 迭 的 对 象 之 间 发 生 了 复制 ， 则 行为 未 定义 。 

返回 值 

函数 vsprintE 返回 写 人 数组 中 的 字符 的 数目 ， 不 包括 终止 的 空 字 符 。 

7.9.7 字符 输入 /输出 函数 
7.9.7.1 函数 fgetc 


概述 


#include <stdio.h> 
int fgetc(FILE *stream); 


说 明 

函数 fgetc 从 stream 指 向 的 输入 流 中 读 取 下 一 个 字符 (如 果 有 的 话 )， 并 把 它 由 
unsigned char 类 型 转换 为 int 类 型 ， 并 且 流 的 相关 的 文件 定位 符 〈 如 果 定 义 的 话 ) 向 前 
移动 一 位 。 

返回 值 

函数 fgetc 返回 stream 指 向 的 输入 流 中 的 下 一 个 字符 。 如 果 输 入 流 在 文件 结束 处 ， 
则 设置 文件 结束 符 ， 函 数 fgetc 返回 EOF。 如 果 发 生 了 读 错误 ， 则 设置 流 的 错误 指示 符 ， 
PRX fgetc 返回 EOF”, 
7.9.7.2 函数 fgets 

概述 


#include <stdio.h> 
char *fgets(char *s, int n, FILE *stream); 
说 明 
函数 fgets 从 stream 指向 的 流 中 读 取 字符 ， 读 取 字 符 的 数目 最 多 比 n 指定 的 数目 少 
1， 然 后 将 字符 写 人 到 s 指向 的 数组 中 。 读 人 换行 符 〈 保 留 ) 或 者 文件 结束 之 后 ， 不 再 读 
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fputc 


fputs 


getc 


取 其 他 的 字符 。 最 后 一 个 字符 写 人 数组 后 立即 写 人 一 个 空 字符 。 

返回 值 

如 果 成 功 执行 ， 则 函数 fgets 返回 s。 如 果 遇 到 文件 结束 并 且 设 有 向 数组 中 写 人 字符 ， 
则 数组 的 内 容 不 变 且 返回 一 个 空 指针 。 如 果 操作 的 过 程 中 发 生 了 读 错误 ， 则 数组 的 内 容 不 
确定 ， 并 返回 一 个 空 指针 。 
7.9.7.3 A% £putc 

概述 


#include <stdio.h> 
int fputc(int c,.FILE *stream); 


说 明 

BR fputc jE c 指定 的 字符 转换 为 unsigned char 类 型 ) 写 到 stream 指向 的 输出 
流 中 相关 的 文件 定位 符 〔 如 果 定 义 的 话 〉 指 定 的 位 置 处 ， 并 把 文件 定位 符 向 前 移动 活 当 的 
位 置 。 如 果 文 件 不 支持 定位 要 求 或 者 流 以 附加 模式 打开 ， 字 符 就 添加 到 输出 流 的 后 面 。 

返回 值 

函数 fputc 返回 写 人 的 字符 。 如 果 发 生 了 写 错 误 ， 则 设置 流 的 错误 指示 符 ， 函 数 
fputc 返回 EOF, 
7.9.7.4 函数 £puts 


#include <stdio.h> 
int fputs(const char *s, FILE *stream); 


说 明 

函数 fputs 把 s 指向 的 串 写 人 stream 指向 的 流 中 ， 不 写 人 结束 的 空 字符 。 

返回 值 

如 果 发 生 了 写 错误 ， 则 函数 fputs 返回 FoF。 否则 ， 它 返回 一 个 非 负 值 。 
7.9.7.5 函数 gete 

概述 


#include <stdio.h> 
int getc(FILE *stream) ; 


说 明 

PRK getc 等 价 于 函数 fgetc， 只 不 过 如 果 gete 作为 一 个 宏 实 现 ， 它 可 能 会 对 stream 
进行 多 次 计算 ， 所 以 它 的 参数 不 能 是 具有 副作用 的 表达 式 。 

返回 值 

函数 gete 返回 stream 指向 的 输入 流 的 下 一 个 字符 。 如 果 流 处 于 文件 结束 处 ， 则 设置 
该 流 的 文件 结束 指示 符 ， 函 数 getc 返回 BoF。 如 果 发 生 了 读 错误 ， 则 设置 流 的 错误 指示 
Tf. PER getc 返回 EOF. 


getchar | 7.9.7.6 函数 getchar 


概述 


#include <stdio.h> 
int getchar (void); 


说 明 
PRX getchar 等 价 于 用 参数 stdin 调用 的 函数 getc。 


putc 


putchar 
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返回 值 

PRIX getchar 返回 stdin 指向 的 输入 流 的 下 一 个 字符 。 如 果 流 处 于 文件 结束 处 ， 则 
设置 流 的 文件 结束 符 ， 函 数 getchar 返回 EOF。 如 果 发 生 了 读 错 误 ， 则 设置 流 的 错误 指示 
ff. getchar 返回 EOF, 


7.9.7.7 FÅ gets 
概述 


#include <stdio.h> 
char *gets(char *s); 


说 明 

PRA, gets 从 stdin 指向 的 输入 流 中 读 取 若干 个 字符 ， 并 将 其 保存 到 s 指向 的 数组 中 ， 
直到 过 到 文件 结束 或 者 读 取 一 个 换行 符 。 所 有 的 换行 符 都 被 丢弃 ， 在 最 后 一 个 字符 读 到 数 
组 中 之 后 立即 写 人 一 个 空 字符 。 

返回 值 

函数 gets 成 功 执行 时 返回 s。 如 果 遇 到 了 文件 结束 并 且 数组 中 没有 读 和 人 任何 字符 ， 则 
数组 的 内 容 保持 不 变 ， 返 回 一 个 空 指针 。 如 果 操 作 的 过 程 中 发 生 了 读 错误 ， 则 数组 的 内 容 
不 确定 ， 返 回 一 个 空 指针 。 
7.9.7.8 函数 pute 

概述 


#include <stdio.h> 
int putc(int c, FILE *stream); 


说 明 

PARK pute 等 价 于 fputc， 只 不 过 如 果 pute 作为 一 个 宏 实现 ， 它 可 能 会 对 stream i+ 
算 多 次 ， 所 以 它 的 参数 不 能 是 有 副作用 的 表达 式 。 

返回 值 

函数 pute 返回 写 入 的 字符 。 如 果 发 生 了 写 错误 ， 则 设置 流 的 错误 指示 符 ，putc 返回 
EOF, 


7.9.7.0 函数 putchar 


概述 
finclude «stdio.h» 
int putchar(int c); 
说 了 明 
函数 putchar 等 价 于 把 stdout 作为 第 二 个 参数 调用 的 putc。 
返回 值 


函数 putchar 返回 写 人 的 字符 。 如 果 发 生 了 写 错误 ， 则 设置 流 的 错误 指示 符 ， 
putchar 返回 EOF。 
7.9.7.10 函数 puts 

概述 


#include <stdio.h> 
int puts(const char *s); 


说 明 

函数 puts 把 s 指向 的 串 写 到 stdout 指向 的 流 中 ， 并 且 在 输出 最 后 添加 一 个 换行 符 。 
不 写 人 结束 的 空 字符 。 

返回 值 

MRAET ÆR. MÅ puts 返回 EoF。 否 则 ， 它 返回 一 个 非 负 值 。 
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ungetc 


fwrite 


7.9.7.11 函数 ungetc 
概述 


#include <stdio.h> 
int ungetc(int c, FILE *stream); 

说 明 

函数 ungetc 把 c 指定 的 字符 (转换 为 unsigned char 类 型 ) 退回 到 stream 指向 的 输 
入 流 中 。 退 回 字符 是 通过 对 流 的 后 续 读 取 并 按照 退回 的 反 顺序 来 返回 的 。 如 果 中 间 成 功 调 
用 (对 同一 个 流 ) 了 一 个 文件 定位 函数 ( fseek、fsetpos 或 者 rewind), MARAE 
的 所 有 退回 的 字符 。 流 的 相应 的 外 部 存储 保持 不 变 。 

退回 的 一 个 字符 是 受到 保护 的 。 如 果 对 同一 个 流 调用 ungetc 函数 太 多 次 ， 中 间 又 没 
有 读 或 者 文件 定位 操作 ， 那 么 这 种 操作 可 能 会 失败 。 

如 果 c 的 值 和 宏 EOF 的 值 相等 ， 则 操作 失败 且 输 入 流 保持 不 变 。 

对 ungetc 的 成 功 调用 会 清空 流 的 文件 结束 符 。 读 取 或 者 丢弃 所 有 回 退 的 字符 之 后 ， 
流 的 文件 定位 符 的 值 和 这 些 字符 回 退 之 前 的 值 相 同 。 对 文本 流 来 说 ， 在 对 函数 ungetc 的 
一 次 成 功 调用 之 后 ， 它 的 文件 定位 符 的 值 是 不 明确 的 ， 直 到 所 有 回 退 字符 被 读 取 或 者 丢弃 
为 止 。 对 二 进 制 流 来 说 ， 每 成 功 调用 一 次 ungetc 之 后 它 的 文件 定位 符 都 会 减 1。 如 果 在 一 
次 调用 之 前 它 的 值 是 零 ， 那 么 调用 之 后 它 的 值 是 不 确定 的 。 

返回 值 

函数 ungetc 返回 转换 后 的 回 退 字符 。 如 果 操 作 失 败 ， 则 返回 EOF. 

参见 : 文件 定位 函数 〈7.9.9)。 
7.9.8 直接 输入 / 输出 函数 
7.9.8.1 函数 fread 

概述 


include <stdio.h> 
size t fread(void *ptr, size t size, size t nmemb, FILE *stream); 


说 明 

函数 fread 从 stream 指 向 的 流 中 读 取 最 多 nmemb 个 元 素 到 ptr 指 向 的 数组 中 ， 
nmemb 的 大 小 是 由 size 指定 的 。 流 的 文件 定位 符 〈 如 果 定 义 的 话 〉 根 据 成 功 读 取 的 字符 
数 向 前 移动 。 如 果 发 生 了 错误 ， 流 的 文件 定位 符 最 后 的 值 是 不 确定 的 。 如 果 只 读 取 了 部 分 
元 素 ， 它 的 值 也 是 不 确定 的 。 

返回 值 

函数 fread 返回 成 功 读 取 的 元 素 的 数目 ， 如 果 发 生 了 读 错 误 或 者 遇 到 了 文件 结束 ， 返 
回 值 可 能 比 nmemb 小 。 如 果 size 或 者 nmemb 为 零 ， 则 fread 返回 零 量 数组 的 内 容 和 流 的 
状态 保持 不 变 。 
7.9.8.2 函数 fwrite 

概述 


#include <stdio.h> 
size_t fwrite(const void *ptr, size_t size, size_t nmemb, 
FILE *stream); 


说 明 

函数 fwrite 从 ptr 指向 的 数组 中 读 取 最 多 memb 个 元 素 并 将 其 写 到 stream 指向 的 流 
rH, nmemb 的 大 小 是 由 size 指定 的 。 流 的 文件 定位 符 《〈 如 果 定 义 的 话 ) 根据 成 功 写 人 的 
字符 数 向 前 移动 。 如 果 发 生 了 错误 ， 流 的 文件 定位 符 最 后 的 值 是 不 确定 的 。 


122 C 标准 的 内 容 249 


fgetpos 


fseek 


fsetpos 


返回 值 

函数 fwrite 返回 成 功 写 人 的 元 素 的 数目 。 如 果 遇 到 了 写 错误 ， 它 可 能 比 nmemb 小 。 
7.9.9 文件 定位 函数 
7.9.9.1 函数 fgetpos 


概述 


#include <stdio.h> 
int fgetpos(FILE *stream, fpos_t *pos); 
说 明 
PA fgetpos 把 stream 指 向 的 流 的 文件 定位 符 的 当前 值 存储 到 pos 指向 的 对 象 中 。 
存储 的 值 包 含 了 来 指明 的 信息 ， 函 数 fsetpos 可 以 使 用 这 些 信 息 来 使 流 重新 定位 到 这 次 调 
用 函数 fgetpos 时 的 位 置 。 
返回 值 
如 果 操 作成 功 ， 函 数 fgetpos 返回 零 ， 如 果 不 成 功 ， 函 数 fgetpos 返回 非 零 并 且 把 一 
个 由 实现 定义 的 正 值 存储 在 errno 中 。 
参见 : PREX fsetpos (7.9.9.3). 


7.9.9.2 函数 fseek 
概述 
#include <stdio.h> 
int fseek(FILE *stream, long int offset, int whence); 


说 明 

PRA. fseek 为 stream 指向 的 流 设置 文件 定位 符 。 

对 二 进 制 流 来 说 ， 新 的 位 置 从 文件 的 开始 以 字符 为 单位 进行 测量 ， 通 过 在 whence få 
定 的 位 置 上 加 上 offset 来 获得 。 如 果 whence 是 SEEK_SET， 指 定 的 位 置 就 是 文件 的 开始 
位 置 ， 如 果 是 SEEK_CUR， 就 是 文件 的 当前 位 置 ， 如 果 是 SEEK_END， 则 是 文件 的 结束 位 置 。 
二 进 制 流 不 需要 严格 支持 whence 为 SEEK END 时 的 fseek 调用 。 

对 文本 流 来 说 ，offset 或 者 是 零 ， 或 者 是 前 面 对 同 一 个 流 调用 ftell 函数 返回 的 值 ， 
whence 应 该 是 SEEK SET, 

对 函数 fseek 的 成 功 调 用 会 清空 流 的 文件 结束 符 并 且 解 除 ungetc PHRMA CI (E 
何 影响 。 调 用 fseek 之 后 ， 对 更 新 后 的 流 的 下 一 个 操作 可 能 是 输入 或 者 输出 。 

返回 值 

RANER ERIN, PRX fseek 才 返 回 非 零 值 。 

参见 : MM ftell (7.9.9.4). 
7.9.9.3 函数 fsetpos 

概述 


#include <stdio.h> 
int fsetpos(FILE *stream, const fpos_t *pos); 


说 明 

PAX fsetpos 根据 pos 指向 的 对 象 的 值 来 设置 scream 指向 的 流 的 文件 定位 符 ，pos 
指向 的 对 象 的 值 应 该 是 前 面 对 同一 个 流 调用 孙 数 fgetpos 得 到 的 返回 值 。 

Xt PRB fsetpos 的 成 功 调用 会 清空 流 的 文件 结束 符 并 且 解 除 ungetc 对 这 个 流 的 影响 。 
调用 fsetpos 之 后 ， 对 更 新 后 的 流 的 下 一 个 操作 可 能 是 输入 或 输出 。 

返回 值 

如 果 操 作成 功 ， 函 数 fsetpos EM, WRAY, MÅ fsetpos 返回 非 零 并 且 把 一 
个 由 实现 定义 的 正 值 存储 在 errno 中 。 
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ftell [7.9.9.4 函数 ftel1 


clearerr 


ferror 


概述 
finclude <stdio.h> 
long int ftell(FILE *stream); 
说 明 
函数 ftell 获得 stream 指向 的 流 的 文件 定位 符 的 当前 值 。 对 一 个 二 进 制 流 来 说 ， 这 
个 值 是 从 文件 开头 到 当前 位 置 的 字符 的 数目 ， 对 一 个 文本 流 来 说 ， 它 的 文件 定位 符 包含 了 
未 说 明 的 信息 ， 函 数 fseek 可 以 使 用 这 些 信 息 来 使 流 的 文件 定位 符 回 到 这 次 调用 ftell 时 的 
位 置 。 这 两 个 返回 值 的 差 值 不 一 定 可 以 作为 读 取 或 者 写 人 的 字符 数 使 用 。 
返回 值 
如 果 成 功 执行 ， 函 数 ftell 返回 流 的 文件 定位 符 的 当前 值 。 如 果 失 败 了 ， 函 数 ftell 
返回 -1L 并 且 把 一 个 实现 定义 的 正 值 存储 在 ermo, 


7.9.9.5 FK rewind 
概述 


#include <stdio.h> 
void rewind(FILE *stream); 


说 明 
函数 rewind 把 stream 指向 的 流 的 文件 定位 符 设置 在 文件 的 开始 位 置 ， 它 等 价 于 


(void) fseek(stream, OL, SEEK SET) 
只 不 过 流 的 错误 指示 符 也 被 清 零 。 
返回 值 
函数 rewind 没有 返回 值 。 
7.9.10 FRUE AR 
7.9.10.1 Å clearerr 


概述 


include <stdio.h> 
void clearerr (FILE *stream); 


说 明 
函数 clearerr 清空 stream 指向 的 流 的 文件 结束 符 和 错误 指示 符 。 
返回 值 
函数 clearerr 没有 返回 值 。 
7.9.10.2 函数 feof 
概述 


#include <stdio.h> 
int feof(FILE *stream) ; 


说 明 

函数 feof 测试 stream 指向 的 流 的 文件 结束 符 。 

返回 值 

当 且 仅 当 stream 流 设置 了 文件 结束 符 时 函数 feof 返回 一 个 非 零 值 。 
7.9.10.3 函数 ferror 

概述 


finclude <stdio.h> 
int ferror (FILE *stream); 
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说 阴 
PAK ferror 测试 stream 指向 的 流 的 错误 指示 符 。 
返回 值 
当 且 仅 当 stream 流 设置 了 错误 指示 符 时 函数 ferror 返回 非 零 。 
perror | 7.9.10.4 函数 perror 
概述 
#include <stdio.h> 
void perror(const char *s); 
说 明 
函数 perror 把 整数 表达 式 errno 中 的 错误 编号 转换 为 一 条 错误 信息 。 它 把 一 个 字符 
序列 写 到 -个 这 样 的 标准 错误 流 : WA OUR s 不 是 空 指针 并 且 s 指向 的 字符 不 是 空 字 
符 )，s 指向 的 串 后 面 跟 一 个 冒号 CO 和 一 个 空格 ， 然 后 是 一 个 适当 的 错误 信息 串 后 面 跟 
一 个 换行 符 。 错 误 信息 串 的 内 容 和 用 参数 errno 调用 丽 数 strerror 的 返回 值 相同 ， 这 是 
由 实现 定义 的 。 
返回 值 
函数 perror 没有 返回 值 。 
参见 : MÅ strerror (7.11.6.2)。 


脚注 

110. 如 果实 现 没有 强制 限制 文件 各 串 的 长 度 ，FILENRME_MAX 的 值 应 该 是 可 以 容纳 一 

个 文件 名 串 的 数组 被 推荐 的 大 小 。 当 然 ， 文 件 名 串 的 内 容 又 受 限 于 其 他 系统 指定 

的 约束 ， 因 此 并 不 是 所 有 长 度 为 FILENRAME_MRX 的 串 都 可 以 成 功 打开 。 

. 实现 不 需要 区 分 文本 流 和 二 进 制 流 。 在 这 样 的 实现 下 ， 文 本 流 中 不 需要 使 用 换行 

符 ， 每 一 行 的 长 度 也 没有 限制 。 

112. 在 Base Document 中 它 被 描述 为 文件 指针 ， 这 个 国际 标准 没有 使 用 这 个 术语 是 为 
了 避免 和 指向 PILE 类 型 的 对 象 的 指针 发 生 混淆 。 

113. 实现 可 能 导致 函数 rename 失败 的 原因 是 文件 已 经 打开 或 者 有 必要 复制 它 的 内 容 
来 使 重 命名 生效 。 

114. 使 用 tmpnam 函数 生成 的 串 创建 的 文件 是 临时 的 ， 只 是 说 它们 的 名 字 不 应 该 和 那 
些 通过 实现 的 常规 命名 规则 生成 的 名 字 冲 突 。 当 对 这 些 文 件 的 使 用 结束 时 ， 仍 然 
有 必要 使 用 函数 remove 在 程序 终止 之 前 来 删除 它们 。 

115. 这 些 序列 后 面 可 能 跟 一 些 附 加 字符 。 

116. gë £reopen 的 基本 作用 是 改变 和 一 个 标准 文本 流 (stderr, stdin 或 者 
stdout) 相关 联 的 文件 ， 因 为 那些 标识 符 不 必 是 可 更 改 的 左 值 ， 本 数 fopen 的 返 
回 值 可 以 赋 给 它 。 

117. 缓冲 的 生存 期 至 少 要 和 打开 的 流 一 样 长， 所 以 当 缓冲 为 自动 存储 类 型 时 ， 打 开 的 
流 应 该 在 缓冲 释放 之 前 关闭 ， 

118. 注意 0 只 是 一 个 标志 ， 而 不 是 字段 宽度 的 开始 。 

119. 对 多 字 节 字符 没有 特别 的 规定 。 

120. 参考 “ 库 的 展望 ”(7.13.6)。 

121. 这 些 空白 字符 不 计 人 指定 的 字段 宽度 。 

122. 对 多 字 节 字 符 没有 特别 的 规定 。 

123. 参考 “ 库 的 展望 ”(7.13.6)。 

124. 4 A% v£printf, vsprintf 和 vprintf 调用 宏 va_arg 时， 返回 后 ara 的 值 是 

不 确定 的 。 

. 文件 结束 和 读 错 误 可 以 通过 使 用 函数 feof 和 ferror 来 区 分 。 
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<stdio.h> 


12.3 


«stdio.h» 的 使 用 


打开 文件 


FILE 类 型 


<stdio.h> 中 声明 的 大 多 数 函 数 是 对 一 个 流 进行 操作 ， 这 个 流 和 一 个 打 
开 的 文件 相关 联 。 一 旦 执行 了 程序 ， 就 可 以 使 用 下 面 3 个 流 : 
读 取 文本 的 标准 源 〈 标 准 输入 流 )。 
写 入 文本 的 标准 目的 地 (标准 输出 流 )。 
输出 错误 信息 的 标准 目的 地 标准 错误 流 )。 


<stdio.h> 中 声明 的 许多 琐 数 都 用 到 了 这 些 流 ， 用 户 不 需要 对 它们 命名 。 
对 那些 需要 一 个 流 参数 的 消 数 ， 可 以 选 其 中 一 个 名 字 作 为 流 参 数 。 


也 可 以 通过 名 字 打 开 一 个 文件 ， 并 和 一 个 流连 接 起 来 。 可 以 通过 调用 池 
数 fopen 或 freopen 把 一 个 流 和 一 个 打开 的 文件 关联 起 来 ， 例 如 : 


fptr = fopen (fname, fmode); 
fptr - freopen(fname, fmode, fptr); 


只 有 当 这 两 个 函数 使 用 模式 fmode 打开 文件 名 为 fname WCF, IFA 
把 该 文件 和 fptr 指向 的 对 象 控制 的 流 联系 起 来 时 ， 它 们 才 返 回 指 向 FILE 
类 型 的 指针 类 型 的 非 空 值 。 

fptr 只 能 作为 C 标准 库 中 其 他 流 的 VO 服务 函数 的 参数 使 用 。 不 要 试 网 
探索 它 所 指向 的 数据 对 象 的 内 部 ， 即 使 某 个 实现 在 <stdio.h> 中 提供 了 可 以 
显示 某 些 域 的 FILE 声明 。 不 要 试图 修改 任何 一 个 域 。 更 不 要 试图 将 其 内 容 
复制 到 另 一 个 类 型 为 FILE 的 数据 对 象 中 并 用 此 副本 来 代替 它 ， 因 为 实现 可 
以 认为 它们 知道 控制 流 的 数据 对 象 的 所 有 有 效 地 址 。( 换 句 话 说 ， 函 数 fopen 
返回 的 地 址 可 能 还 有 其 他 作用 ， 不 仅仅 是 存储 在 该 地 址 上 的 值 。) 

一 旦 通过 成 功 调用 函数 fclose (at uth ROA FA PAA freopen) 关闭 
了 一 个 流 ， 就 不 要 再 使 用 它 对 应 的 fptr 的 值 。 它 所 指向 的 存储 空间 将 会 被 重 
新 分 配 或 是 重新 利用 。( 更 不 要 复制 指针 的 值 。 严 格 来 说 ， 实 现 发 现 一 个 指 
针 指向 了 一 个 已 经 被 重新 分 配 的 空间 时 就 会 崩溃 .) 

用 户 也 不 需要 知道 FILE 类 型 数据 对 象 的 内 部 表示 ， 他 们 只 需要 知道 在 
其 他 东西 中 可 以 通过 某 种 方式 表示 它 : 
D 文件 结束 符 记 录 是 否 需 要 结束 此 文件 。 
口 错误 指示 符 记 录 读 或 写 是 否 导致 不 可 恢复 的 数据 传输 错误 。 
D 文件 定位 符 记录 从 文件 中 读 出 或 写 入 的 下 一 个 字 节 〔 这 在 某 些 类 型 

的 文件 中 可 能 没有 定义 )。 ` 
Q 缓冲 信息 记录 任何 读 写 缓冲 区 是 否 存在 和 它 的 大 小 。 
O 状态 信息 决定 下 一 个 是 读 操作 还 是 写 操作 。 
对 于 正在 命名 的 文件 ， 最 好 避免 把 任何 文件 名 写 人 代码 中 。( 这 是 一 个 


口 stdin 
Q stdout 


QO stderr 


模式 


读 和 写 


函数 fgetc 
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好 办 法 ， 其 中 的 原因 有 很 多 。〉 如 果 要 输入 或 创建 一 个 文件 名 ,使 用 一 个 可 
以 容纳 FILENAME MAX (<stdio.h> 中 定义 了 这 个 宏 ) 个 字符 的 缓冲 区 。 假 
设 一 个 文件 名 是 一 个 常规 的 以 空 字符 结尾 的 串 。 不 要 关心 内 部 实现 ， 也 不 要 
删除 文件 名 中 的 任何 字符 。 
如 果 必 须 创 建文 件 名 ， 例 如 头 文 件 名 ， 原 则 是 越 简单 越 好 。 任 何 实现 几 
乎 都 可 以 接受 由 1 到 6 个 英文 字母 ， 后 面 跟 一 个 点 ， 后 面 再 跟 一 个 英文 字母 
构成 的 文件 名 。 例 如 "myhar.h" Hinz. vn, ABU Die TI AE, 
也 可 能 不 区 分 。 不 要 期 望 这 些 名 字 在 操作 系统 中 不 修改 就 可 以 使 用 。C 标准 
库 可 能 需要 将 它们 映射 为 某 些 其 他 的 形式 来 遵守 当地 用 法 。 
文件 模式 是 由 以 下 3 个 字母 中 的 一 个 开头 的 字符 串 。 
O r 说 明 要 打开 已 存 的 文件 用 来 读 取 数据 。 
D w 说 明 要 打开 已 存 的 文件 用 来 写 人 数据 并 且 丢 弃 原 来 的 数据 ， 或 者 创 
建 一 个 初始 时 没有 任何 内 容 的 新 文件 。 

D a 与 w 的 作用 一 样 ， 只 是 增加 了 一 条 : 在 对 流 进行 写 操作 之 前 ， 将 文 
件 定位 符 置 于 文件 结束 处 。 

口 模式 后 面 也 可 以 加 上 以 下 两 个 可 选 的 字符 ， 顺 序 不 定 。 

O + 说 明 可 以 对 打开 用 来 读 取 数 据 (用 1 的 文件 进行 写 操 作 ,或 者 可 
以 对 打开 用 来 写 数据 (用 ww 或 a) 的 文件 进行 读 操作 。 

Ob 说 明 打 开 一 个 二 进 制 文件 而 不 是 文本 文件 。 

还 可 以 在 上 述 字 符 之 后 加 上 其 他 的 字符 。 每 个 实现 都 可 以 定义 哪些 附加 
的 参数 〈 如 果 有 的 话 ) 可 以 作为 fmode 的 一 一 部 分 来 编写 。 例如， 系统 允许 
编写 下 面 的 代码 : 

fopen (fname, "w, lrecl=132, recfm=fixed") 

在 System/370 中 ， 至 少 有 一 种 C 实现 认为 上 述 语句 是 请 求 新 建 一 个 定 长 
记录 即 每 个 记录 长 度 为 132 字 节 的 文件 。 然 而 ， 没 有 任何 标准 规定 定义 的 模 
式 后 面 的 内 容 。 如 果 程 序 要 在 各 种 实现 之 间 移 植 ， 使 用 其 他 模式 的 fopen 调 
用 可 能 会 失败 或 者 出 现 隐秘 的 错误 。 

C 标准 库 为 流 的 读 和 写 提供 了 大 量 的 函数 ， 例 如 ， 可 以 读 取 单 个 字符 ， 
读 取 一 定 长 度 的 字符 ， 或 是 读 取 多 个 字符 并 将 它们 转化 为 格式 串 控制 的 某 种 
编码 形式 。 

这 里 详细 地 定义 了 函数 fgetc 读 取 单 个 字符 的 过 程 ， 其 他 所 有 函数 都 
被 定义 为 好 像 多 次 调用 函数 fgetc 来 获得 输入 字符 ， 不 管 它 们 实际 是 否 这 样 
ihe KA fgetc 首先 保证 流 支持 普通 的 读 操 作 同时 一 个 读 请 求 被 及 时 接受 
(参考 本 节 后 面 的 “缓冲 区 控制 ”部 分 ); 然后 决定 是 否 需 要 给 流 分 配 一 个 组 
冲 区 ， 如 果 需 要 ， 则 请 求 分 配 ， 接 着 它 确定 是 否 需要 执行 一 个 物理 读 操作 
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〈 填 满 一 个 空 的 缓冲 区 或 者 直接 输入 字符 )， 如 果 需 要 ， 就 执行 这 个 操作 。 它 
在 发 生物 理 读 操 作 错 误 时 会 设置 一 个 错误 指示 符 ， 或 者 在 其 文件 结束 处 发 生 
物理 读 操 作 时 设置 文件 结束 符 。 完 成 以 上 操作 后 就 有 一 个 字符 需要 传送 ， 该 
随 数 就 传送 它 并 且 将 文件 定位 符 向 前 移动 一 个 字符 。 


对 每 个 字符 都 执行 所 有 这 些 操 作 的 实现 一 定 很 慢 。 所 以 就 不 必 奇 怪 为 什 
么 在 过 去 几 年 里 实现 者 尽 最 大 的 努力 删 减 那 些 不 必要 的 操作 。 一 个 主要 的 技 
巧 是 尽 可 能 少 地 进行 物理 读 操作 ， 一 次 操作 尽 可 能 多 地 读 取 字 符 ， 然 后 简要 
地 记录 数据 流 的 状态 以 快速 测试 每 个 字符 。 事 实 上 ， 冰 数 getc 传统 上 是 一 个 
E, CERRI fgetc 的 加 速 版 本 。 


标准 C 要求 油 数 getc 也 要 作为 一 个 真正 的 函数 来 表示 。 头 文件 
<stdio.h> 能 够 ， 也 通常 用 宏 来 屏蔽 这 个 函数 声明 。 这 个 宏 能 够 且 通 常 一 定 
会 纵容 对 指向 FILE 参数 的 指针 进行 多 次 值 计算 的 不 安全 操作 。 头 文件 也 能 
用 一 个 宏 定 义 来 屏蔽 函数 fgetc( 或 是 其 他 任何 函数 )。 唯 一 的 不 同 是 一 定 要 
保证 宏 而 不 是 函数 getc (和 putc)， 对 它 的 每 一 个 参数 只 执行 一 次 求 值 操 
作 ， 这 样 求 值 的 副作用 和 调用 一 个 真正 的 两 数 的 相同 。 


写 操作 与 读 操作 很 相似 。 原 始 函 数 fputc 可 将 一 个 字符 写 人 流 。 消 数 
fputc 首先 确保 数据 流 支 持 普通 的 写 操作 且 一 个 写 请 求 及 时 被 响应 《〈 人 参考 本 
节 后 面 的 “缓冲 区 控制 ”部 分 )， 然 后 决定 是 否 需要 给 流 分 配 一 个 缓冲 区 ， 如 
果 需 要 ， 就 请 求 分 配 ， 接 着 决定 是 否 需 要 执行 一 个 物理 写 操作 释放 一 个 满 
的 缓冲 区 或 是 直接 输出 字符 )， 如 果 需 要 ， 就 执行 这 项 操作 。 它 在 发 生物 理 
写 错误 时 设置 错误 指示 符 ， 完 成 以 上 工作 后 ， 如 果 字 符 被 送 进来 ， 该 涌 数 就 
让 文件 定位 符 向 前 移动 一 个 字符 。 同 样 ， 一 个 典型 的 实现 会 用 一 个 可 能 不 安 
全 的 屏蔽 宏 定 义 来 实现 相关 函数 pute. 


从 开始 到 结尾 连续 写 或 读 一 个 流 是 很 普遍 的 。 事 实 上 ， 许 多 来 自 终 端 和 
管道 的 像 流 一 样 的 伪 文 件 只 能 以 这 种 方式 处 理 。 不 过 ， 当 需要 重新 处 理 数据 
或 是 以 随机 顺序 处 理 数据 时 就 会 出 现 例 外 。 这 些 例外 情况 需要 用 各 种 方法 改 
变 文 件 定位 符 的 正常 行进 。C 标准 库 为 此 提供 了 3 种 不 同 的 机 制 来 修改 文件 
定位 符 : 

C) ungetc 使 刚 从 一 个 流 中 读 出 的 字符 退回 流 中 。 

O fseek, ftell 和 rewinga 记 住 文件 定位 符 并 将 其 恢复 到 之 前 的 位 置 ， 

假定 文件 定位 符 可 以 编码 为 long 类 型 。 

C) fgetpos、fsetpos Fil rewind 记 住 一 个 任意 的 文件 定位 符 并 将 其 恢 

复 到 以 前 的 位 置 。 
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函数 ungetc 


函数 ungete 甚至 能 在 不 支持 文件 定位 请 求 的 流 上 工作 ， 例 如 来 自 终端 
或 是 管道 的 流 。 它 可 以 回 退 -个 和 刚才 读 取 的 不 同 字符 。 如 果 在 对 一 个 流 
的 第 一 次 读 取 之 前 调用 这 个 函数 ， 它 甚至 可 以 在 文件 开始 之 前 回 退 一 个 字 
符 。 


然而 ， 在 两 个 读 操作 之 间 ， 各 种 实现 允许 回 退 字符 的 数目 也 不 同 。 即 使 
不 连续 地 调用 格式 化 输入 函数 〈 例 如 scanf)， 且 这 些 函 数 也 需要 一 个 回 退 字 
符 ， 这 时 也 可 以 保证 一 个 回 退 字 符 。 对 于 一 个 可 移植 的 程序 ， 不 要 认为 可 以 
回 退 多 个 字符 。 

PR Å ungetc 与 定位 文件 的 其 他 两 个 机 制 之 间 的 联系 很 小 。X3J11 委员 会 
花 了 很 多 时 间 去 整理 调用 函数 ungetc 和 fseek 的 各 种 序列 的 语义 。 一 般 规 
则 是 道 过 函数 ungetc 回 退 的 字符 会 在 任何 其 他 文件 定位 请 求 之 后 消失 。 但 
是 仔细 阅读 函数 说 明 ， 就 能 确保 得 到 期 望 的 结果 。 我 的 建议 是 除了 读 请 求 外 
AO PR ungetc 的 调用 与 其 他 函数 调用 混合 使 用 。 

RÅ fseek 和 ftell (I rewind) 是 C 早期 发 展 的 传统 的 文件 定位 天 
数 ， 它 们 假定 文件 定位 符 可 以 编码 为 long 类 型 ， 就 像 12.1 节 中 所 提 到 的 。 
这 个 假设 在 UNIX 中 成 立 ， 因 为 在 UNDE 中 文件 的 长 度 不 会 超过 2” 个 字 节 
而 且 可 以 将 文件 定位 在 任意 字 节 上 。 但 是 对 于 支持 更 大 文件 或 是 需要 更 详细 
的 文件 定位 信息 的 系统 ， 这 个 假设 可 能 不 成 立 。 


例如 ， 一 个 文本 文件 可 能 被 结构 化 为 块 和 块 内 记录 一 一 将 一 个 块 编号 ， 
记录 编号 和 记录 内 部 的 偏 移 量 打包 成 long 类 型 可 能 会 需要 不 可 能 实现 的 任意 
一 个 字 节 来 协调 。 由 于 这 些 原因 ， 陋 数 ftell 可 能 会 失败 (返回 -1)， 而 不 
是 返回 一 个 文件 定位 符 的 错误 编码 。 


可 以 使 用 fseek 和 ftell 提前 随机 访问 一 个 二 进 制 文件 (如 果 文 件 不 是 
KAK) 的 若干 个 字 节 。 在 这 种 情况 下 ， 编 码 的 文件 定位 符 就 是 从 当前 位 置 到 
文件 开头 《〈 即 字 节 为 零 的 位 置 ) 的 以 字 节 为 单位 的 偏 移 量 。 可 以 用 这 样 的 文 
件 定位 符 执行 算术 运算 ,或 是 从 头 开始 计算 它们 ， 而 且 肯 定 能 得 到 期 望 的 字 
节 数 。 


但 是 文本 文件 中 编码 的 文件 定位 符 在 不 同 实现 中 有 不 同 的 格式 。 使 用 
ftell 将 会 得 到 一 个 标志 文件 当前 位 置 的 信息 。( 如 果 它 不 能 对 当前 文件 定位 
符 进行 编码 ， 它 就 会 返回 一 个 失败 编码 。) 在 同一 程序 后 面 的 执行 过 程 中 且 关 
闭 这 个 文件 之 前 ， 传 递 给 fseek 相同 的 值 可 以 使 文件 定位 符 恢 复 较 早 的 值 。 
不 要 认为 可 以 将 这 样 的 值 从 一 个 程序 的 执行 保存 到 下 一 个 程序 的 执行 中 ， 或 
者 是 从 一 个 打开 的 文件 保存 到 下 一 个 打开 的 文件 中 ， 因 为 实现 对 这 种 编码 采 
用 的 方式 可 能 会 非常 奇怪 。 
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fgetpos 
fsetpos 


缓冲 区 控制 


setvbuf 
setbuf 


函数 fflush 


如 果 只 需要 重新 定位 之 前 访问 过 的 文件 位 置 ， 那 么 就 应 该 使 用 第 三 种 机 
制 。 委 员 会 添加 了 函数 fgetpos 和 fsetpos 来 支持 任意 大 小 和 结构 的 文件 
的 定位 。 这 些 函 数 工作 时 要 使 用 <stdio.h> 中 定义 的 fpos_t 类 型 的 值 ， 而 
该 类 型 的 结构 和 一 个 实现 对 任意 文件 定位 符 进 行 编码 的 结构 一 样 复杂 。 假 设 
fpos_t 是 一 个 只 能 对 它 进行 复制 、 作 为 函数 参数 传递 或 者 作为 一 个 函数 值 来 
接收 的 结构 类 型 。 甚 至 对 于 一 个 二 进 制 文件 ， 也 没有 定义 一 种 方式 来 对 这 些 
值 进行 比较 或 是 执行 算术 运算 。 


原则 上 ， 用 户 可 以 在 一 定 程 度 上 对 UO 函数 操作 流 时 缓冲 数据 的 方式 进 
行 控制 ， 但 是 缓冲 是 以 各 种 UO 模式 的 推测 为 基础 的 一 个 优化 ， 这 些 推 测 通 
常 都 是 正确 的 ， 并 且 很 多 实现 都 遵循 用 户 的 建议 ， 但 是 它们 并 不 是 一 定 要 这 
么 做 。 实 现 可 以 随意 忽略 用 户 大 部 分 的 缓冲 请 求 。 


然而 ， 如 果 一 个 更 大 的 缓冲 区 可 以 提高 性 能 或 者 一 个 更 小 的 缓冲 区 可 以 
节省 空间 ， 用 户 还 可 以 提供 自己 的 后 备 缓冲 区 。 在 打开 文件 之 后 且 对 流 进行 
任何 其 他 操作 之 前 ， 调 用 函数 setvbuf。( 避免 使 用 旧 函 数 setbuf， 它 的 灵 
活性 较 差 .可 以 指定 VO 是 完全 缓冲 、 行 缓冲 ， 还 是 无 缓冲 。 这 可 能 会 影响 
程序 的 性 能 。 


有 时 可 能 需要 大 部 分 时 间 内 都 进行 缓冲 ， 但 又 要 对 输出 流 被 清空 到 外 部 
设备 的 时 间 进 行 有 限 的 控制 。 函 数 fflush 就 可 以 保证 被 调用 的 时 候 ， 有 一 
个 或 更 多 的 流 清 空 到 外 部 。 这 有 利于 在 一 个 交互 式 环境 中 输出 信息 ， 它 也 可 
以 使 数据 库 更 加 健壮 以 便 防 止 偶 然 出 现 的 程序 崩溃 。 然 而 在 标准 C 中 函数 
fflush 对 输入 流 的 影响 没有 任何 定义 。 不 能 像 在 UNIX 下 那样 调用 这 个 函 
数 在 提示 符 出 现 之 前 可 靠 地 丢弃 输入 。 


C 标准 库 不 允许 某 些 模式 的 读 和 写 。 基 本 规则 是 在 中 间 没 有 文件 定位 
请 求 的 情况 下 ， 一 个 读 操作 后 不 能 紧 跟着 一 个 写 操作 ， 或 是 一 个 写 操作 不 
能 紧 跟 着 一 个 读 操 作 。 再 具体 一 点 ， 中 间 调 用 必须 是 函数 fflush, fseek, 
fsetpos 或 rewind。 设 置 了 文件 结束 指示 器 的 读 操 作 后 面 可 紧 跟 一 个 写 操 
作 ， 但 是 ， 非 常 奇 怪 的 是 ， 前 面 有 一 个 隐 式 的 寻找 〈 对 一 个 以 fmode 模式 打 
开 的 以 a 开 头 的 文件 ) 的 写 操作 后 面 不 可 以 紧 跟 一 个 读 操作 。 图 12-1 是 一 个 
总 结 这 些 规 则 的 状态 转移 图 。 


最 后 一 条 建议 是 尽 可 能 地 给 VO 流 函 数 自 由 。 不 要 试图 严格 地 控制 缓冲 。 
可 以 让 一 个 实现 对 它们 进行 优化 ， 而 所 有 其 他 实现 不 对 它们 进行 优化 。 而 且 
不 要 任意 地 将 读 操 作 、 写 操作 和 各 种 文件 定位 操作 混合 使 用 ， 因 为 这 样 可 能 
会 使 实现 崩溃 ， 也 很 容易 使 你 自己 的 程序 崩溃 。 
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图 12-1 
流 的 状态 


OPEN 


WRITE 
POSITION 


POSITION POSITION 


WRITE 
NOT AT EOF 


格式 化 输出 输入 /输出 的 一 个 重要 方面 是 执行 格式 化 输出 。LO 几乎 总 是 在 C 语言 
中 最 早 接触 的 ， 就 像 下 面 这 个 流行 的 第 一 个 程序 : 
finclude «stdio.h» 
int main(void) 
( /* say hello */ 
printf("hello world\n"); 
) 
除非 只 编写 其 人 式 程序 ， 否 则 格式 化 输出 很 可 能 是 用 户 必 须 掌 握 的 一 种 最 重 
要 的 VO 方法 。 


一 个 程序 可 以 产生 只 有 另 一 个 计算 机 程序 喜欢 或 者 理解 的 输出 。 如 果 两 
个 程序 在 同一 个 体系 结构 中 运行 ， 那 么 它们 共用 对 数据 编码 的 符号 。 一 个 程 
序 可 以 编写 整 型 和 浮 点 型 的 标量 ， 甚 至 是 结构 和 联合 ， 而 且 另 一 个 程序 可 以 
立即 读 取 它 们 并 对 它们 进行 操作 。 程 序 间 可 以 通过 从 二 进 制 文件 复制 字 节 或 
是 将 字 节 复制 到 该 文件 中 来 共享 除 指针 类 型 以 外 的 其 他 任何 类 型 的 数据 。 


然而 ， 如 果 想 在 运行 于 不 同 计算 机 体系 结构 下 的 程序 间 共 享 数据 ， 就 一 
定 要 更 加 小 心 。 不 同 的 计算 机 对 整数 和 浮 点 数 编码 的 方式 通常 是 不 同 的 。 即 
使 两 个 计算 机 在 数量 级 和 编码 方式 上 相同 ， 它 们 在 内 存 中 存储 一 个 多 字 节 数 
据 对 象 的 各 个 字 节 的 顺序 也 通常 不 相同 。 


不 同 计算 机 对 存储 对 齐 的 要 求 也 有 很 大 区 别 ， 所 以 结构 内 部 〈 和 结构 与 
联合 的 尾部 ) 的 空隙 变化 比 预期 的 要 多 。 除 非 你 非常 细心 ， 否 则 最 好 不 要 把 
二 进 制 文件 作为 数据 交换 的 媒介 。 
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第 12 章 


FT EN eR 


vfprintf 
vprintf 
vsprintf 


<stdio.h> 


文本 文件 有 以 下 3 个 重要 的 方面 优 于 二 进 制 文件 。 

口 只 有 人 才能 生成 和 修改 它们 。 

口 它们 可 以 被 写 到 一 台 打 印 机 或 是 一 个 终端 上 ， 而 且 人 们 基本 上 可 以 
理解 其 显示 的 内 容 。 

口 它们 可 以 被 不 共享 数据 编码 方式 的 程序 共享 。 


为 编码 的 数据 设计 一 种 文本 表示 方法 的 过 程 叫做 输出 格式 化 。 打 印 函 数 
(都 将 print 作为 它们 名 字 的 一 部 分 且 都 在 <stdio.h> 中 声明 ) 产生 格式 化 
输出 。 要 使 用 这 些 打印 函数 ， 必 须知 道 如 何 调用 它们 ， 如 何 说 明 格式 ， 以 
及 它们 将 会 执行 什么 转换 。C 标准 库 提供 了 6 个 不 同 的 打印 函数 ， 声 明 如 
Fi 

int fprintf (FILE *stream, const char *format, ... ); 

int printf (const char *format, ...); 

int sprintf (char *dest, const char *format, ... ); 

int vfprintf (FILE * stream, const char *format, va list ap); 


int vprintf (const char *format, va list ap); 
int vsprintf (char *dest, const char *format, va list ap); 


PU BU PRL ABER SZ — format 参数 ， 它 是 一 个 指向 只 读 的 以 空 字符 结 
尾 的 字符 串 的 指针 。 这 个 格式 告诉 函数 期 望 附 加 的 参数 是 什么 《如 果 有 的 
话 ) 以 及 如 何 转 换 它们 。 它 也 指定 了 散布 在 任意 转换 后 的 参数 之 间 的 字面 量 
文本 。 下 面 会 详细 讨论 打印 格式 。 


所 有 的 函数 都 返回 在 一 次 特定 调用 中 生成 的 文本 字符 的 计数 值 。 其 中 两 
个 函数 sprintf 和 vsprintf 将 生成 的 字符 保存 在 一 个 以 空 字 符 结束 的 字符 
tB dest 中 。 因 为 无 法 将 字符 串 的 最 大 长 度 告诉 这 些 打印 函数 以 进行 检查 ， 
所 以 用 户 必须 对 格式 和 转换 后 的 数据 有 足够 的 了 解 ， 以 确保 字符 串 能 够 放 进 
所 提供 的 存储 空间 。 剩 余 的 4 个 函数 把 数据 写 入 流 中 。( 那 些 没 有 stream 参 
数 的 函数 把 数据 写 到 流 stdout rp. 如 果 为 流 的 任何 一 个 写 操作 设置 了 错误 
指示 符 ， 那 么 它们 将 返回 一 个 负 值 而 不 是 字符 的 累加 计数 值 。 


函数 fprintf, printf 和 sprintf 接受 一 个 可 变 参 数 表 。 当 然 ， 这 些 附 
加 的 参数 主要 用 于 传递 需要 转变 成 文本 的 数据 。 为 了 得 到 最 大 的 可 移植 性 ， 
必须 通过 包含 «stdio.h» EAR DE RÅ. 


这 3 个 函数 很 灵活 ， 有 时 不 好 区 分 。C 程序 员 偶尔 需要 有 细微 区 别 的 打 
印 函 数 。 此 时 就 可 以 选用 vfprintf, vprintf 和 vsprintf 这 3 4- PAR. E 
了 接收 附加 参数 的 方式 以 外 ， 每 个 函数 的 行为 与 其 对 应 的 名 字 中 没有 开头 
的 函数 的 行为 一 样 。 使 用 <stdarg.h> 中 定义 的 宏 来 编写 一 个 接受 可 变 参 数 
表 的 包装 函数 。 这 些 附加 参数 被 传人 打印 函数 中 ， 以 执行 实际 的 转换 和 文本 
生成 。 
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打印 格式 


打印 字面 量 
文本 


例如 ， 如 果 需 要 将 一 些 格式 化 信息 写 到 stderr 中 ， 且 每 条 信息 前 都 加 
一 个 标准 前 级 ， 还 需要 将 每 一 条 错误 信息 都 记录 到 一 个 磁盘 文件 中 ， 那 么 就 
H LA 475 PR eprint 来 实现 所 有 这 些 ， 其 中 该 函数 使 用 vfprintf 来 执行 
实际 的 输出 。 


#include <stdio.h> 
#include <stdarg.h> 


int eprint(const char *format, ... ) 
{ /* log error messages */ 
extern FILE *logfile; 
int n; 
va_list ap; 


va_start (ap, format); 
fprintf(stderr, "\aERROR:"}; 
vfprintf(stderr, format, ap); 

va start(ap, format); 
n-vfprintf(logfile, format, ap); 
va end(ap); 

returnín); 


) 、 

每 个 打印 函数 调用 的 主体 部 分 是 为 它 指定 的 格式 串 。 在 一 个 微型 编程 语 
言 中 可 以 《而 且 应 该 ) 把 格式 串 作 为 程序 来 考虑 。 打 印 函 数 通过 从 开始 到 结 
尾 对 格式 串 进行 一 次 扫描 来 解释 地 执行 这 个 程序 。 当 它 识别 出 格式 串 的 每 个 
组 成 部 分 时 ， 就 会 执行 各 种 操作 。 大 多 数 操作 都 生成 一 些 字符 ， 该 函数 将 这 
些 字符 写 入 流 中 或 存储 到 内 存 中 。 

大 多 数 操作 都 需要 将 参数 值 转变 成 字符 序列 。 每 个 这 样 的 参数 都 必须 按 
照 格式 串 需要 它们 的 顺序 出 现在 可 变 参数 表 中 。 例 如 : 

print£("ts%c%o%i", "th", 'x', 9, 38); 

经 过 4 次 转换 (th|x|11|38) 之 后 产生 字符 串 thx1138。 程 序 员 必 须 确 
保 实际 的 参数 表达 式 的 类 型 与 打印 函数 期 望 的 类 型 相 匹 配 ， 因 为 标准 C 无 法 
检测 可 变 参 数 表 中 附加 参数 的 类 型 。 

一 定 要 牢记 附加 参数 遵循 的 类 型 转换 规则 ， 与 在 原型 声明 范围 之 外 调用 的 
函数 的 参数 的 相同 。 例 如 一 个 float 类 型 的 参数 转换 成 一 个 double 类 型 的 参数 ， 
一 个 char 或 是 short 类 型 的 参数 转换 成 一 个 int 类 型 的 参数 。 打 印 函 数 可 以 根据 
需要 对 参数 进行 强制 类 型 转换 以 便 将 它们 的 范围 限制 到 某 个 特定 转换 所 期 望 的 
范围 。 只 有 指定 一 个 超出 最 终 类 型 范围 的 参数 值 时 ， 才 可 能 会 看 到 这 种 机 制 。 
例如 ， 转 换 说 明 符 sc 期 望 一 个 int 类 型 的 参数 ， 这 个 参数 将 被 转换 为 unsigned 
char 类 型 。 所 以 表达 式 printf("$c",0x203) 仅 把 3 写 入 标准 输出 流 。 

并 不 是 格式 串 的 每 一 部 分 都 需要 附加 参数 的 转换 。 事 实 上 ， 只 有 某 些 
转换 说 明 才 针 对 所 有 的 参数 。 每 一 个 转换 说 明 都 以 转 义 字符 百 分 号 &% 开头 并 
且 和 下 面 给 出 的 模式 之 一 相 匹 配 。 打 印 函 数 把 格式 串 中 的 其 他 所 有 部 分 都 


AE 


当 作 字 面 基 文本 来 对 待 。 字 面 量 文本 的 每 一 个 字符 生成 输出 的 一 个 字符 。 
严格 地 讲 ， 一 个 格式 串 是 一 个 多 字 节 字符 串 。 它 允许 在 输出 转换 中 添加 

日 文中 的 汉字 (或 者 阿拉 伯 文 ， 或 其 他 任意 字符 )。 如 果 执 行 环境 对 多 字 节 

字符 使 用 一 个 独立 于 状态 的 编码 ， 那 么 每 一 个 字面 量 文本 的 序列 必须 以 初始 


为 了 构建 一 个 有 效 的 转换 说 明 ，% 后 面 要 跟 4 个 组 成 部 分 。 除 了 最 后 一 


D 零 个 或 者 更 多 的 标志 ， 用 来 说 明 标 准 转换 中 的 变化 。 

O 一 个 可 选 的 字段 宽度 ， 用 来 指定 转换 生成 的 字符 的 最 小 数 日 。 

O 一 个 可 选 的 精度 ， 控 制 某 些 转换 生成 的 字符 的 数目 。 

O 一 个 转换 说 明 符 ， 用 来 确定 参数 的 类 型 、 参 数 转 换 后 的 值 的 类 型 和 转 


要 按照 上 面 的 顺序 书写 这 些 组 成 部 分 。 下 面 分 别 详细 地 讨论 每 一 部 分 。 

D 一 个 负 号 (-)， 表 示 将 一 个 转换 左 对 齐 ， 右 边 填 充 空格 。 例 

Oo 一 个 零 (0, ， 如 果 没 有 指定 其 他 的 填充 字符 ， 就 用 0《〈 在 任何 符号 或 
者 前 缀 之 后 ) 填充 起 始 的 部 分 。 例 如 %04x。 

D 一 个 正 号 (+)， 当 一 个 正 的 有 符号 的 数 被 转换 时 ， 产 生 一 个 显 式 的 加 

D 一 个 空格 ， 当 一 个 正 的 有 符号 值 被 转换 时 ， 产 生 一 个 空格 来 代替 符 


O 一 个 # 号 ,改变 某 些 转换 的 行为 。o 转换 在 前 面 加 上 一 个 0，x 转 换 
在 前 面 加 上 一 个 Ox, 浮 点 数 转换 ， 生成 一 个 小 数 点 ， 即使 后 面 没有 


字段 宽度 被 表示 为 一 个 无 符号 的 十 进 制 整 数 。 写 一 个 星 号 ， 然 后 打印 也 
数 就 把 下 一 个 int 参数 作为 字段 宽度 对 待 ， 一 个 负 值 被 当 作 负 标志 对 待 。 一 
个 生成 小 于 字段 宽度 个 字符 的 转换 会 被 填充 。 在 没有 负 或 者 零 标 志 的 情况 下 ， 
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的 转移 状态 开始 和 结束 。( 参 考 第 13 章 。) 
转换 说 明 
个 部 分 ， 其 他 的 都 是 可 选 的 。 
换 方式 。 
可 以 指定 以 下 5 种 不 同 的 标志 。 
如 $-30s, 
t. PG +54, 
i$. fans 5a. 
小 数 部 分 。 例 如 %#x。 
字段 宽度 
左边 用 空格 填 满 。 例 如 $10c 和 3*i. 
精度 


精度 的 表示 是 以 句点 〈.) 开头 ， 后 跟 一 个 无 符号 十 进 制 整数 。 单 独 一 个 
句点 指 精度 为 零 。 如 果 是 一 个 句点 后 跟 一 个 星 号 ， 打 印 清 数 就 把 下 一 个 int 
参数 当 作 精度 ， 一 个 负 值 当 作 零 对 待 。 精 度 指 定 了 : 
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打印 转换 
说 明 符 


字符 
十 进 制 数 


浮 点 数 


转换 一 个 整数 时 生成 的 数字 的 最 小 位 数 ; 
e、 已 或 者 王 转换 生成 的 小 数 数字 的 位 数 ; 
GRA G 转换 生成 的 有 效 数 字 的 最 大 位 数 ; 

O s 转换 生成 的 字符 的 最 大 数目 。 
følt $.10e 和 %.*s。 

可 以 用 一 个 或 者 两 个 字符 的 序列 来 表示 一 个 转换 说 明 符 ， 该 序列 来 自 一 
个 预先 定义 好 的 包含 30 多 个 有 效 序列 的 表 。 双 字符 的 序列 以 一 个 h、1 或 者 
LL 开头 来 说 明 可 替代 的 转换 类 型 。 王 面 列 出 了 所 有 的 有 效 序列 。 如 果 希 望 代 
码 可 以 移植 ， 就 不 要 使 用 其 他 任何 序列 。 

每 一 个 格式 化 输出 转换 的 目标 都 是 生成 一 个 文本 序列 ， 这 个 文本 序列 在 转 
换 前 完全 可 以 表示 编码 的 值 。 不 幸 的 是 , .关于 如 何 “ 完 全 地 ”表示 〈 即 使 是 一 
个 简单 的 整数 值 ) 存在 很 多 不 同 的 观点 。 这 也 是 存在 这 么 多 不 同 的 书写 转换 说 
明 的 方式 的 原因 。 对 很 多 转换 来 说 ,“ 完 全 地 ”的 意思 就 是 “精确 地 ”。 但 是 对 
浮 点 转换 来 说 ， 任 何 文本 表示 都 可 能 只 是 原始 值 的 一 个 近似 值 。 可 以 指定 保留 
多 少 位 精度 ， 也 可 以 保证 值 的 符号 和 数量 级 可 以 被 正确 表示 。 然 而 ， 如 果 把 文 
本 串 转 换 为 它 的 原始 编码 类 型 ， 就 不 要 希望 它 可 以 得 到 完全 相同 的 值 。 

下 面 是 各 种 各 样 的 转换 说 明 符 。 记 住 ， 每 一 个 转换 都 服从 填充 规则 ， 就 
像 上 面 为 标志 和 字段 宽度 所 描述 的 那样 。 如 果 没 有 指定 精度 P， 那 么 假设 它 为 
规定 的 默认 值 。 

Oc 把 int 参数 转换 为 unsigned char 参数 来 生成 一 个 字符 。 

O d 一 一 把 in 参数 转换 为 一 个 至 少 p 个 十 进 制 数 的 有 符号 序列 ， 默 认 

精度 是 1。 

D hd 一 一 把 int 参数 转换 为 short 参数 ， 然 后 和 d 相同 。 
1à——long 参数 的 转换 和 a 相同 。 
C) e 一 一 把 double 参数 转换 为 一 个 形 如 à. aaaesaa 的 有 符号 序列 。 这 里 ， 
qd 代表 一 个 十 进 制 位 ， + 或 者 是 一 个 正 号 (+)， 或 者 是 一 个 负 号 (-)， 
点 是 当前 区 域 设置 的 小 数 点 。 如 果 p 是 零 而 且 没 有 指定 # 标志 ， 它 就 会 
省 上 略 小 数 点 。 它 生成 p 个 小 数位 和 至 少 两 个 指数 位 。 默 认 的 精度 是 6. 
Le 一 一 对 long double 参数 作 和 e 相同 的 转换 。 
一 一 对 double 参数 作 和 e 相同 的 转换 ， 只 不 过 把 指数 前 面 的 e S E. 
LE—— x} long double ZPUE E 相同 的 转换 。 
f 一 一 把 doulbe 类 型 的 参数 转换 为 一 个 形式 为 a.49d 的 有 符号 序列 。 
这 里 ，a 代表 一 个 十 进 制 位 ， 小 数 点 是 当前 区 域 设置 的 小 数 点 。 它 生 
成 至 少 一 个 整数 位 。 如 果 p 为 零 而 且 没 有 指定 # 标志 ， 它 就 省 略 小 
数 点 。 它 生成 p 个 小 数位 。 默 认 的 精度 是 6. i 
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口 


DOD DO 
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<stdio.h> 


十 进 制 
字符 计数 


指向 void 的 


指针 字符 串 


十 六 进 制 


ANS 


口 


口 


口 
口 


LE 一 一 对 long double ZERUERI £ 相同 的 转换 。 

g—— X1 double 类 型 的 参数 作 和 e 或 者 f 相同 的 转换 。 如 果 p 没 有 
被 指定 或 者 为 0， 则 把 p 设 图 为 6 MÅ e 形式 会 产生 一 个 闭 区 间 
[-4,p-1] 内 的 指数 ， 则 选择 三 形 式 。 省 略 小 数 后 面 所 有 的 零 。 如 果 
没有 小 数位 而 县 没有 指定 # 标志 ， 那 么 就 省 略 小 数 点 。 


Lg 一 一 对 long double 参数 作 和 g 相同 的 转换 。 

G 一 一 对 double 参数 作 和 a 相同 的 转换 ， 只 是 把 任意 指数 前 的 e 替换 为 E。 
LG— AX long double 类 型 参数 作 和 G 相同 的 转换 。 

i. hi, li 分 别 和 d. ha, id 相同 。 

n 一 一 在 指向 int 类 型 的 指针 所 指向 的 数据 对 象 中 存储 生成 字符 的 累 
积 数目 。 

hn 参数 为 指向 short 类 型 的 指针 ， 用 法 和 n 相同 。 

1n 参数 为 指向 long 类 型 的 指针 ， 用 法 和 n 相同 。 


o— 48 int 参数 转换 为 unsigned int 参数 ， 然 后 转换 为 至 少 P 个 八 进 
制 位 的 无 符号 序列 。 默 认 的 精度 是 1. 

ho 一 一 把 int 参数 转换 为 unsigned short 参数 ， 其 余 操作 和 o 相同 。 

1o 一 一 对 long 参数 类 型 作 和 o 相同 的 转换 。 

P 一 一 把 指向 vo 过 参数 的 指针 转换 为 一 个 由 实现 定义 的 字符 序列 《〈 例 
如 一 个 存储 地 址 的 十 六 进 制 表示 )。 

s 一 一 为 每 一 个 存储 在 指向 char 参数 的 指针 指向 的 串 中 的 字符 〈 非 
空 ) 产生 一 个 字符 。 如 果 指 定 了 精度 ， 则 最 多 生成 p 个 字符 。 

uu 一 一 把 int 参数 转换 为 unsigned int 参数 ， 然 后 转换 为 至 少 有 P 个 十 
进 制 位 的 无 符号 序列 ， 默 认 的 精度 是 1。 

hu 一 一 把 int 参数 转换 为 unsigned short 参数 ， 其 余 操作 和 相同 。 

lu 一 一 把 long 参数 转换 为 unsigned long 参数 ， 其 余 操作 和 nu 相同 。 

x 一 一 把 int 参数 转换 为 unsigned 证 参数 ， 然 后 转换 为 一 个 至 少 有 P 
个 十 六 进 制 位 的 无 符号 序列 。 它 用 a 到 f 的 字母 来 表示 数字 10 到 15 
的 数字 。 默 认 的 精度 是 1。 

hx 一 一 把 int 参数 转换 为 unsigned short 参数 ， 其 余 操 作 和 并 相同 。 

Xx 一 一 对 int 参数 作 和 x 相同 的 转换 ， 只 不 过 它 用 A 到 F 的 字母 来 表 
示 10 到 15 的 数字 。 

hx 一 一 把 int 参数 转换 为 unsigned short 参数 ， 其 余 操 作 和 Xx 相同。 


1x 一 一 把 long 参数 转换 为 unsigned long 和 参数， 其 余 操 作 和 X HE]. 
$$ 一 一 不 转换 任何 参数 ， 生 成 一 个 百 分 号 字符 。 


转换 说 明 符 能 够 处 理 大 部 分 格式 化 需要 。 当 它们 不 能 满足 需求 的 时 候 ， 
可 以 通过 两 步 得 到 想 要 的 格式 。 首 先 ， 使 用 sprintf 在 缓冲 区 生成 一 个 文本 
并 在 那里 对 它 进行 修改 ;， 然 后， 使 用 函数 ， 例 如 Printf， 输 出 这 个 文本 。 可 
以 参考 图 6-1 的 函数 _Fmtval， 这 是 一 个 实际 的 例子 。 
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格式 化 输入 


扫描 函数 


并 不 是 所 有 的 程序 都 读 取 输 入 。 那 些 可 以 读 取 输 入 的 程序 可 以 使 用 标准 
库 函 数 直接 读 取 数据 ， 然 后 把 数据 解释 为 它们 认为 合适 的 形式 。 为 程序 的 内 
部 使 用 而 转换 小 整数 和 文本 串 是 大 部 分 C 程序 员 很 容易 做 的 工作 。 所 以 ， 只 
有 当 必 须 转换 序 点 值 或 者 识别 一 个 复杂 的 数据 域 集合 的 时 候 ， 那 些 标准 扫描 
PRISCA nl FE BE th ER 
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序 的 可 用 性 很 大 程度 上 决定 于 它 对 用 户 输入 的 多 样 性 的 承受 能 力 。 一 个 程序 
员 可 能 不 同意 标准 格式 化 输入 函数 强迫 的 转换 ， 也 可 能 不 喜欢 它们 处 理 错误 
的 方式 。 总之， 他 们 可 能 更 喜欢 使 用 他 们 自己 的 输入 方式 。 


获得 格式 化 输 和 人 并 不 是 简单 地 执行 产生 格式 化 输出 的 反 操 作 。 通 过 输 
出 ， 程 序 员 可 以 知道 程序 下 一 步 要 做 什么 ， 而 且 它 确实 这 么 做 了 。 然 而 ， 通 
过 输入 ， 程 序 员 更 多 地 是 被 输入 那些 文本 的 人 所 控制 。 程 序 必须 扫描 输入 文 
本 的 一 切 可 识别 的 样式 ， 然 后 把 它 分 解 为 单独 的 几 个 域 。 只 有 这 个 时 候 ， 程 

序 才 知 道 下 一 步 做 什么 。 


不 仅 如 此 ， 输 入 文本 可 能 包含 不 可 识别 的 样式 ， 这 时 必须 确定 对 这 样 的 
“错误 ”作出 怎样 的 反应 。 是 输出 一 条 错误 信息 然后 提示 重新 输入 ? 还 是 提前 
作 一 些 可 能 的 猜测 然后 鲁莽 前 行 ? 还 是 直接 中 止 程序 的 执行 ? 各 种 各 样 的 成 
品 输入 扫描 器 已 经 尝试 过 了 所 有 这 些 策略 ， 但 是 没有 一 个 能 适应 所 有 的 情况 。 


因此 ，C 语言 格式 化 输入 函数 的 历史 要 比 格式 化 输出 鸡 数 复杂 得 多 。 大 
部 分 C 实现 对 printf 函数 族 的 基本 属性 很 早 以 前 就 达成 了 共识 。 相 比 之 下 ， 
scant 函数 族 这 些 年 来 则 一 直 在 改变 并 且 版 本 越 来 越 多 。X3J11 委员 会 不 得 
不 花费 很 长 时 间 来 整理 格式 化 输入 的 恰当 行为 。 


扫描 函数 被 这 样 称 呼 的 原因 是 所 有 的 函数 都 把 scan 作为 它们 名 字 的 一 
部 分 。 这 些 函 数 用 来 扫描 输入 文本 并 把 文本 域 转换 为 编码 的 数据 ， 它 们 都 在 
<stdio.h> 中 声明 。 要 使 用 扫描 函数 ， 必 须知 道 怎 样 调用 它们 、 怎 样 指定 转 
换 格式 和 它们 会 为 你 实现 什么 样 的 转换 。C 标准 库 提 供 了 3 TA PIAS f ee 
数 ， 声 明 如 下 : 


int fscanf (FILE *stream, const char *format, aes VG 
int scanf(const char *format, 
int sscanf (char *src, const char * format, e); 


函数 fscanf 从 流 stream 中 得 到 字符 。 函 数 scanf 从 流 stdin 中 得 到 
字符 。 如 果 获 得 字符 的 操作 过 到 了 流 的 文件 结束 标志 或 者 错误 说 明 符 ， 这 两 
个 函数 都 会 提前 停止 扫描 输入 。 也 数 sscanf 从 以 空 字符 结尾 的 字符 串 里 获 
得 字符 ， 该 字符 串 是 从 sre 开始 的 。 当 函数 遇 到 上 串 的 结束 的 空 字符 时 ， 它 就 
会 提前 停止 扫描 输入 。 
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和 打印 函数 一 样 ， 所 有 的 扫描 函数 都 接受 可 变 参 数 表 。 并 且 和 打印 函数 
一 样 ， 在 使 用 任何 扫描 函数 之 前 ， 最 好 通过 包含 <stdio.h> 来 对 它们 进行 声 
BA. 


FA EO PR BE AD BEE — format 参数 ， 这 个 参数 是 一 个 指向 可 读 的 且 以 
空 字符 结尾 的 串 的 指针 。 格 式 告诉 函数 所 需要 的 附加 参数 (如 果 有 的 话 ， 和 
怎样 把 输入 域 转换 为 要 存储 的 值 。( 一 个 典型 的 参数 是 一 个 指向 接收 转换 值 的 
数据 对 象 的 指针 。) 它 也 指定 转换 域 之 间 想 要 匹配 的 字面 量 文 本 或 空白 。 如 果 
扫描 格式 看 起 来 和 打印 格式 非常 相似 ， 那 么 这 种 相似 很 有 可 能 是 有 意 的 。 但 
是 它们 之 间 也 存在 很 多 重要 的 区 别 。 下 面 会 非常 详细 地 讨论 扫描 格式 。 


所 有 的 扫描 函数 都 返回 一 个 文本 域 转换 为 存储 值 的 数目 的 计数 值 。 然 
而 ， 如 果 任 何 一 个 函数 因为 上 面 列举 的 某 个 原因 而 提前 停止 扫描 ， 它 就 返回 
«stdio.h» 中 定义 的 宏 EOF 的 值 。 因 为 EOF 一 定 是 一 个 负 值 ， 所 以 可 以 很 容 
易 地 把 它 和 任何 有 效 的 计数 和 零 区 别 开 。 然 而 ， 却 不 能 知道 在 停止 扫描 前 存 
储 了 多 少 个 值 。 如 果 需 要 对 停止 扫描 点 进行 更 精确 的 定位 ， 那 么 可 以 把 扫 撒 
调用 分 解 为 多 个 调用 。 


扫描 函数 也 可 能 在 遇 到 一 个 不 知道 怎么 处 理 的 字符 时 中 止 扫描 。 在 这 种 
情况 下 ， 孙 数 返回 被 转换 和 存储 的 值 的 总 数 。 对 任何 给 定 的 调用 ， 可 以 通过 
对 格式 中 指定 的 所 有 转换 进行 计数 来 确定 最 大 可 能 的 返回 值 。 实 际 的 返回 值 
会 在 零 和 这 个 最 大 值 之 间 ， 包 含 零 和 这 个 最 大 值 。 


当 fscanf 或 者 scant 获得 一 个 期 望 之 外 的 字符 时 ， 它 把 这 个 字符 退回 
到 输入 流 。( 当 它 必须 向 前 访问 来 确定 域 的 末端 时 ， 它 也 要 把 有 效 域 之 外 的 
第 一 个 字符 回 退 。) 它 这 样 做 的 方法 和 调用 函数 ungetc 很 相似 。 然 而 ， 两 者 
仍然 存在 一 个 很 重要 的 区 别 。 不 能 通过 对 ungetc 的 连续 调用 (并 且 流 中 没 
有 其 他 的 中 间 操 作 ) 来 方便 地 把 两 个 字符 回 退 到 流 中 。 对 于 相同 的 流 ， 可 以 
方便 地 在 调用 一 个 任意 的 扫描 珊 数 之 后 调用 ungetc RÅ. 


这 就 意味 着 ，ungetc 带 来 的 单字 符 回 退 的 限制 不 能 通过 调用 扫描 函数 来 
折 中 。 或 者 实现 保证 两 个 或 者 更 多 的 字符 回 送 到 流 中 ， 或 者 它 为 扫描 涡 数 提 
供 独 立 的 机 制 。 


扫描 函数 最 多 回 退 一 个 字符 。 例 如 ， 假 设想 把 无 效 域 123EASY 作为 浮 点 
值 转换 。 甚 至 子 域 123E 也 是 无 效 的 ， 因 为 这 种 转换 要 求 至 少 有 一 个 指数 位 。 
子 域 123E 被 处 理 ， 然 后 转换 就 会 失败 。 没 有 值 被 存储 且 扫 描 函 数 返回 。 从 流 
中 读 取 的 下 一 个 字符 是 A。 这 种 行为 对 浮 点 域 影响 最 大 ， 因 为 浮 点 数 的 语法 最 
复杂 。 其 他 的 转换 通常 可 以 消化 那些 看 起 来 有 效 的 最 长 子 域 的 所 有 字符 。 
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扫描 格式 


扫描 格式 与 
打印 格式 


扫描 空白 


前 面 ， 我 把 打印 格式 描述 成 一 个 小 型 的 程序 设计 语言 。 当 然 ， 扫 描 格 
式 也 是 如 此 。 前 面 我 也 说 过 ， 打 印 格式 和 扫描 格式 非常 相似 。 这 旬 话 应 该 
起 到 一 把 双 为 剑 的 作用 。 好 的 一 方面 是 ， 打 印 和 扫描 函数 设计 的 初衷 是 在 
一 起 工作 。 在 一 个 程序 中 写 到 一 个 文本 文件 的 内 容 应 该 可 以 作为 一 个 文本 
文件 被 另 一 程序 读 取 。 通 过 调用 一 个 打印 责 数 在 文本 中 表示 的 任何 值 都 应 
该 可 以 通过 调用 一 个 扫描 函数 来 获取 。( 至 少 在 一 个 合理 的 取 值 范围 内 它们 
的 精确 度 应 该 很 高 。) 甚至 可 以 让 打印 和 扫描 格式 彼此 非常 相似 ， 也 有 可 能 
写 出 对 称 的 格式 ， 即 可 以 读 取 输出 值 的 格式 。 然 而 ， 这 要 花费 一 点 额外 的 
功夫 。 

这 里 隐藏 着 危险 。 事 实 是 ， 打 印 和 扫描 格式 语言 是 有 区 别 的 。 有 时 候 ， 
明显 的 相似 性 只 是 表面 现象 。 可 以 通过 调用 打印 陋 数 来 输出 文本 ， 但 是 其 扫 
描 方式 与 使 用 相同 的 格式 调用 扫描 陶 数 时 的 扫描 方式 不 同 。 当 使 用 没有 空 牛 
的 转换 进行 文本 输出 时 要 特别 注意 这 一 点 。 通 过 两 次 连续 调用 打印 函数 来 打 
印 邻 接 的 空白 时 也 要 小 心 。 扫 描 函 数 可 能 会 把 程序 员 认 为 独立 的 域 放 在 一 起 
处 理 。 

扫描 函数 的 基本 操作 确实 和 打印 函数 的 相同 。 调 用 一 个 扫描 水 数 ， 它 就 
从 头 到 尾 对 格式 串 扫 描 一 次 。 当 它 识别 出 格式 串 的 每 一 个 组 成 部 分 的 时 候 ， 
它 就 执行 各 种 操作 。 大 部 分 操作 都 顺序 使 用 了 流 (fscanf 或 者 scanf) 或 者 
存储 在 内 存 中 的 串 (sscanf) 中 的 字符 。 

很 多 操作 都 产生 了 一 些 值 ， 扫 找 函 数 把 这 些 值 存储 在 各 种 用 指针 参数 所 
指定 的 数据 对 象 中 。 这 样 的 参数 都 必须 按照 格式 串 需要 它们 的 顺序 出 现在 可 
变 参 数 表 中 。 例 如 : 

sscanf("thx 1138", "%s%20%d", &a, &b, &C); 

是 把 指向 串 “thx” 的 指针 存储 在 char 数组 a 中 ， 把 值 11 存储 在 int Å 
据 对 象 b 中 ， 把 值 38 存储 在 in 数据 对 象 c 中 。 用 户 要 保证 每 一 个 实际 的 参 
数 指针 的 类 型 和 扫描 函数 希望 的 类 型 瑟 配 ， 因 为 标准 C 不 能 检测 可 变 参 数 表 
中 的 附加 参数 的 类 型 。 

并 不 是 格式 串 的 每 一 部 分 都 要 求 域 的 转换 和 附加 参数 的 使 用 。 事 实 上 ， 
只 有 某 些 转换 说 明 才 使 用 参数 。 每 一 个 转换 说 明 都 以 转 义 字符 & 开 头 ， 并 且 
和 下 面 给 出 的 其 中 一 种 模式 匹配 。 扫 描 函 数 把 其 他 所 有 的 东西 都 作为 空白 字 
符 或 者 字面 量 文本 对 待 。 

扫描 函数 中 的 空白 包含 <ctype.h> 中 声明 的 函数 isspace 所 能 判断 的 
所 有 字符 。 如 果 调 用 了 <locale.h> FRÅ AY PAR setlocale， 这 些 字符 会 
BUE. JO 区 域 设置 中 ， 空 白 就 是 我 们 已 经 知道 且 喜 欢 的 那些 字符 。( 参 
考 第 2 章 。) 
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扫描 字面 量 
文本 


扫描 转换 说 明 


赋值 取消 


字段 宽度 


扫描 转换 
说 明 符 


扫描 函数 把 扫描 格式 中 的 一 个 或 者 多 个 空白 字符 的 一 个 序列 作为 一 个 
实体 对 待 。 这 样 的 序列 使 扫描 函数 读 取 并 丢弃 输入 的 任意 长 度 的 空白 字符 
的 序列 。 格 式 中 的 空白 不 需要 和 输入 中 的 相同 ， 输 入 也 可 以 不 包含 空白 。 
格式 中 的 空白 只 是 为 了 保证 下 一 个 输入 字符 (如 果 有 的 话 ) RE "zer 
字符 。 


格式 中 的 任何 非 空 白字 符 和 不 是 转换 说 明 符 的 一 部 分 的 字符 都 要 求 文字 
匹配 。 下 一 个 输入 字符 必须 和 格式 字符 匹配 。 否 则 ， 扫 描 消 数 返 回 当 前 存储 
的 转换 值 的 个 数 。 一 个 以 文字 匹配 结束 的 格式 可 能 会 产生 模糊 的 结果 。 我 们 
不 能 从 返回 值 确定 是 否 存在 尾部 的 不 匹配 。 同 样 ， 也 不 能 确定 是 否 发 生 了 文 
字 匹 配 错误 或 者 它 后 面 有 没有 转换 。 由 于 这 些 原 央 ， 在 扫描 格式 中 要 限制 文 
字 匹 配 的 使 用 。 


文字 匹配 可 以 是 多 字 节 字符 的 任意 串 。 如 果 执 行 环境 对 多 字 节 字符 使 用 
状态 独立 编码 ， 那 么 每 一 个 字面 量 文本 的 序列 都 要 以 它 的 初始 转移 状态 开始 
和 结束 。( 人 参考 第 13 章 。) 


扫描 转换 说 明和 打印 转换 说 明 的 基本 方式 不 同 。 扫 描 转 换 说 明 符 不 能 编 
写 任 何 打印 转换 标志 和 精度 〈 小 数 点 后 面 )。 相 反 ， 它 有 一 个 赋值 取消 标志 和 
一 个 叫做 扫描 集 的 转换 说 明 。% 后 面 可 以 按照 以 下 顺序 写 3 个 组 成 部 分 ， 除 
了 最 后 一 部 分 ， 其 他 的 都 是 可 选 的 。 
O 可 以 用 可 选 的 星 号 〈*) 来 指定 赋值 取消 
如 gx*s《〈 它 会 跳 过 任意 的 非 空 白字 符 序列 )。 
O 在 确定 转换 域 的 时 候 ， 使 用 可 选 的 字段 宽度 来 指定 要 匹配 的 输入 字符 
的 最 大 数目 。 字 段 宽度 是 一 个 无 符号 十 进 制 整数 。 它 不 限制 开头 的 
任意 空白 的 数量 。 例 如 %5i。 
Oo 使 用 转换 说 明 符 来 确定 参数 的 类 型 、 确 定 转换 域 的 方式 和 要 存储 的 转 
换 值 的 方式 。 可 以 在 括号 CUD 之 间 使 用 扫描 集 转换 说 明 符 。 所 有 其 
他 的 都 由 一 个 预定 义 的 表 中 的 一 个 或 者 两 个 字符 的 序列 组 成 ， 这 个 
表 包 含 了 30 多 个 有 效 的 序列 。 两 个 字符 的 序列 以 ha、1 或 者 工 开 头 ， 
来 说 明 可 替代 的 参数 类 型 。 下 面 就 对 扫描 集 进行 说 明 ， 也 列 出 了 所 
有 的 有 效 序列 。 如 果 想 让 代码 可 移植 ， 在 扫描 格式 中 就 别 使 用 任何 
其 他 的 东西 。 


每 一 个 格式 化 输入 转换 的 作用 是 确定 组 成 要 转换 的 域 的 输入 字符 序列 。 
如 果 可 能 的 话 ， 扫 描 函 数 之 后 就 会 转换 这 个 域 ， 并 且 把 转换 后 的 值 存储 在 下 
一 个 指针 参数 指向 的 数据 对 象 中 。( 如 果 赋 值 被 取消 ， 就 不 处 理 函 数 的 任何 


不 存储 转换 的 值 。 例 


参数 。) 


扫描 数字 域 


字符 
十 进 制 数 


浮 点 数 


普通 整数 


字符 计数 


八进制 数 
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除非 下 面 有 具体 说 明 ， 否 则 每 一 次 转换 首先 跳 过 输入 中 的 任意 的 空白 。 
跳 过 空白 的 方式 跟 扫 撒 格 式 中 处 理 空 折 的 方式 一 样 。 然 后 转换 根据 随后 输入 
字符 的 匹配 模式 来 确定 转换 域 。 可 以 指定 一 个 字段 宽度 来 限制 域 的 大 小 。 否 
则 ， 这 个 域 将 一 直 延 伸 到 与 选 定 模式 匹配 的 最 后 一 个 输入 字符 。 

扫描 函数 通过 调用 FIBS<stdlib.h> 中 声明 的 C 标 准 库 函数 strtod、 
strtol、 或 strtoul 来 转换 数字 域 。 一 个 数字 转换 域 与 最 长 可 接受 的 模式 匹配 。 

下 而 的 描述 中 简要 地 概括 了 每 一 个 有 效 的 转换 说 明 符 的 匹配 模式 和 转换 
规则 。w 代表 指定 的 字段 宽度 或 是 没有 指定 字段 宽度 时 的 默认 值 。ptr 代表 
要 使 用 的 可 变 参 数列 表 中 的 下 一 个 参数 。 


口 


口 


c 一 一 将 w 个 字符 《〈 默 认 值 为 1) 存储 在 指针 ptr 所 指 的 char 类 型 的 
数组 中 。 它 不 跳 过 开头 的 空白 。 

Qd 一 一 以 10 ASEM, WRIA PAR strtol 来 转换 整 型 输入 域 ， 然 后 
将 结果 存放 在 指针 ptr 所 指 的 大 类 型 的 变量 中 。 

h 一 一 转换 方式 与 a 一样， 但 结果 存储 在 short 类 型 的 变量 中 。 

1d 一 一 转换 方式 与 9 一 样 ， 但 结果 存储 在 long 类 型 的 变量 中 。 
SEAT PR strtod 来 转换 浮 点 型 输入 域 ， 然 后 将 结果 存放 
在 指针 ptr 所 指 的 float 类 型 的 变量 中 。 

le 一 一 转换 方式 与 一样， 但 结果 存储 在 double 类 型 的 变量 中 。 
Le 一 一 转换 方式 与 e 一 样 ， 但 结果 存储 在 long double 类 型 的 变量 中 。 
EE、lE、ILE- 一 一 做 法 分 别 与 e、le 和 Le 相同 。 

E. LE, Lët AU D e, le 和 Le 相同 。 

q、1g、Lg 一 一 做 法 分 别 与 e、1le 和 Le 相同 。 

G、1G、LG 一 一 做 法 分 别 与 ese、1le 和 Le 相同 。 

LO AER, TIA A en strtol 来 转换 整数 输入 域 ， 然 后 
将 结果 存储 在 指针 ptr 所 指 的 int 类 型 的 变量 中 。( 输 入 时 要 以 0、 
Ox 或 是 0 开头 来 指定 实际 的 基数 。) 

hi 一 一 转换 方式 和 i 相间， 结果 存 储 在 short 类 型 的 变量 中 。 

1i 一 一 转换 方式 和 i 相同 ， 结 果 存储 在 long 类 型 的 变量 中 。 

不 转换 输入 ， 但 是 将 与 输入 字符 匹配 的 累计 值 存储 在 指针 ptr 
所 指 的 int 类 型 的 变量 中 。 

hn 一 一 转换 方式 与 n 相同 ， 结 果 存 储 在 short 类 型 的 变量 中 。 

ln 一 一 转换 方式 与 n 一 样 ， 结 果 存 储 在 long 类 型 的 变量 中 。 

o 一 一 以 8 为 基数 ， 通 过 调用 函数 strtoul 来 转换 整 型 输入 ， 然 后 将 
结果 存储 在 指针 ptr 所 指 的 unsigned int 类 型 的 变量 中 。 

ho 一 一 转换 方式 与 o 一 样 ， 但 结果 存储 在 unsigned short 类 型 的 变量 中 。 
1o 一 一 转换 方式 与 o 一 样 ， 但 结果 存储 在 unsigned long 类 型 的 变量 中 。 
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Ir 
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指向 void 的 
指针 


字符 串 


无 符号 十 进 制 
数 


十 六 进 制 数 


百 分 号 
扫描 集 


扫描 函数 的 
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口 _B 一 一 转换 指针 输入 域 ， 然 后 将 结果 存储 在 指针 ptr 所 指 的 指向 void 
的 指针 中 。 每 一 个 实现 都 定义 了 它 的 指针 输入 域 以 和 打印 函数 写 人 的 
指针 保持 一 致 。 

D s 一 一 将 最 多 w 个 非 空 白字 符 存 储 在 指针 ptr 所 指 的 char 类 型 的 数 
组 中 。 它 首先 跳 过 开头 的 空白 ， 最 后 总 是 在 所 有 输入 之 后 存储 一 个 
空 字 符 。 

D u 一 一 以 10 为 基数 ， 通 过 调用 函数 strtoul 来 转换 整 型 输入 域 ， 然 
后 将 结果 存储 在 指针 ptr 所 指 的 unsigned int 类 型 的 变量 中 。 

O hu 转换 方式 与 ut 一 样 ， 结 果 存 储 在 unsigned short 类 型 的 变量 
中 。 

C) lu 一 一 转换 方式 与 一样， 结果 存储 在 unsigned long 类 型 的 变量 中 。 

O x 一 一 以 16 HAO, EAA PAR strtoul 来 转换 整 型 输入 域 然后 
将 结果 存储 在 指针 ptr 所 指 的 unsigned int 类 型 的 变量 中 。 

D hx 一 一 转换 方式 与 x 一样 ， 但 结果 存储 在 unsigned short 类 型 的 变量 中 。 

口 1x 一 一 转换 方式 与 x 一 样 ， 但 结果 存储 在 unsigned long 类 型 的 变量 中 。 

D x、hx、1Xx 一 一 做 法 分 别 与 x、hx 和 Lx 相同 。 

O $8 一 一 不 转换 输入 ， 与 一 个 百 分 号 字符 (%) 匹配 。 

扫描 集 的 行为 与 s 转换 说 明 符 的 很 相像 ， 它 将 最 多 w 个 字符 (默认 是 剩 
余 的 输入 ) 存储 在 指针 ptr 所 指 的 char 类 型 的 数组 中 ， 而 且 总 是 在 所 有 输入 
之 后 存储 一 个 空 字 符 。 它 不 跳 过 开头 的 空白 ， 也 人 允许 指定 可 以 作为 域 的 一 部 
分 的 字符 。 可 以 指定 匹配 的 所 有 字符 ， 例 如 %[0123456789abcdefABCDEF]， 
它 与 一 个 任意 的 十 六 进 制 数 的 序列 相 匹 配 。 或 者 可 以 指定 所 有 不 匹配 的 字符 ， 
例如 %[^0123456789]， 它 与 任意 的 非 数 字 字 符 相 匹 配 。 

如 果 想 在 指定 的 字符 集合 中 包含 右 括号 〈(])， 则 可 以 直接 将 右 括号 写 在 
打开 的 [或 (I^) AR, MAS 可 以 扫描 方 括号 。 不 能 将 空 字符 包含 
在 指定 的 字符 集合 中 。 某 些 实现 可 能 允许 用 减 号 (-) 来 指定 字符 区 间 。 例 
如 ， 十 六 进 制 数 字 表 可 以 写 为 $[0-9abcdefABCDEF] ， 甚 至 在 某 些 情况 下 写 
为 %[0-9a-fA-F]。 然 而 ， 这 种 用 法 是 不 通用 的 。 如 果 希 望 程序 具有 最 大 的 可 移 
植 性 ， 就 要 避免 使 用 它 。 

扫描 转换 说 明 没 有 打印 转换 说 明 那 么 完备 。 用 户 经 常 希望 对 输入 扫描 进 ` 
行 更 多 的 控制 ， 或 者 有 时 不 能 确定 一 个 扫描 失败 的 具体 位 置 ， 所 以 就 不 能 从 
失败 中 适当 地 恢复 。 可 以 通过 与 增加 打印 函数 一 样 的 方法 来 弥补 这 些 不 足 。 
首先 ， 将 希望 扫描 的 数据 读 到 一 个 缓冲 区 中 。( 有 时 甚至 可 以 用 可 以 容忍 贡 
格式 输入 ， 例 如 "ss "。) 然后 使 用 函数 sscant 重复 扫描 缓冲 区 直到 找到 一 个 
成 功 的 匹配 或 是 确定 了 输入 错误 的 属性 。 然 而 ， 当 超过 某 一 点 的 时 候 扫描 函 
数 就 很 难 再 正确 执行 了 。 而 且 多 年 的 实践 证 明 它 们 的 用 途 还 是 有 限 的 。 
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BUFSIZ 


FILENAME MAX 


FOPEN MAX 


 TOLBF 


SEEK END 


SEEK SET 


TMP MAX 


下 面 对 <stdio.h> 中 的 每 一 个 名 字 做 一 些 简 单 的 说 明 。 

BUFSI2 一 一 这 个 宏 产 生 流 缓冲 区 的 首选 大 小 。 它 的 典型 范围 是 从 几 百 到 
一 于 多 个 字 节 。 可 以 使 用 setvbuf 来 把 该 宏 作为 声明 的 任意 缓冲 区 的 大 小 使 用 。 

EOF 一 一 这 个 宏 用 于 标志 文件 的 结束 。 尽 管 它 是 一 个 负 值 ， 但 是 其 至 
«ctype.h» 中 声明 的 隆 数 都 把 它 作 为 参数 值 来 接受 它 。<staio.h> 中 声明 的 
一 些 函 数 也 把 它 作为 一 个 错误 返回 值 来 使 用 。 很 多 实现 选择 -1 作为 EOF 的 
值 ， 但 并 不 是 所 有 的 实现 都 这 样 做 。 

FILENAMF,_MAX 一 一 这 个 宏 定义 了 足够 存放 任意 文件 名 的 字符 缓冲 区 的 长 
度 。 使 用 它 来 声明 或 是 分 配 这 样 的 缓冲 区 。 在 某 些 系统 中 ， 它 的 长 度 可 以 是 
数 百 个 字 节 。 

FOPEN_MAX 一 一 这 个 宏 说 明了 程序 至 少 可 以 同时 打开 的 文件 数 。 那 3 个 
标准 VO 流 都 包含 在 内 。 例 如 ， 可 以 把 这 个 值 用 在 要 创建 许多 中 间 临 时 文件 
的 程序 中 ， 这 样 就 可 以 在 新 建 任何 文件 之 前 计划 文件 的 使 用 。 每 一 个 实现 必 
须 保证 至 少 可 以 同时 打开 8 个 文件 。 这 表明 一 个 可 移植 的 程序 最 多 可 以 同时 
打开 5 个 附加 文件 。 

_IOFBF 一 一 使 用 这 个 宏 作 为 setvbut 的 mode (第 三 个 ) 参数 来 表示 完全 缓冲 。 

_IOLBF 一 一 使 用 这 个 宏 作 为 setvbuf DÉI mode (第 三 个 ) 参数 来 表示 行 缓 冲 。 

_IONBF 一 一 使 用 这 个 宏 作为 setvbuf 的 mode (第 三 个 ) 参数 来 表示 没有 缓冲 。 

L_tmpnam 一 一 这 个 宏 定义 了 足够 存放 一 个 临时 文件 名 的 字符 缓冲 区 的 长 
度 。 使 用 它 来 声明 或 是 分 配 这 样 的 缓冲 区 。 在 某 些 系统 中 ， 它 的 长 度 可 以 是 
数 百 个 字 节 。 

NUIT 一 一 参考 11.3 节 。 


SEFK_CUR 一 一 将 这 个 宏 作 为 fseek 的 mode (第 三 个 ) 参数 来 表明 相对 
于 当前 的 文件 定位 符 的 一 个 定位 。 对 于 文本 文件 ， 这 种 模式 只 对 零 偏 移 量 有 
效 ， 它 不 执行 任何 操作 。 

SEEK_END 一 一 将 这 个 宏 作为 fseek 的 mode (第 三 个 ) 参数 来 指示 相对 于 
文件 结束 的 一 个 定位 。 记 住 ， 一 个 二 进 制 文件 可 能 有 附加 的 空 字符 ， 所 以 这 种 
模式 存在 不 确定 的 结果 。 对 于 文本 文件 ， 可 以 用 这 种 模式 来 指定 没有 偏 移 量 。 

SEEK_SET 一 一 将 这 个 宏 作为 fseek DÉI mode (第 三 个 ) 参数 来 指示 相对 于 
文件 开始 的 一 个 定位 。 对 于 文本 文件 ， 偏 移 量 必须 是 零 ， 或 是 对 于 同一 个 数 
据 流 上 一 次 调用 函数 ftell 的 返回 值 。 

TMP_MAX 一 一 这 个 宏 指明 函数 tmpnam 开始 循环 之 前 ， 至 少 可 以 生成 的 不 : 
同文 件 名 的 个 数 。 例 如 ， 可 以 将 这 个 值 用 在 要 创建 许多 临时 中 间 文 件 的 程序 
中 ， 这 样 就 可 以 在 新 建 任 何 文件 之 前 计划 文件 的 使 用 。 每 一 实现 必须 保证 至 
少 可 以 生成 25 个 不 同 的 文件 名 。 
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stderr 
stdin 
stdout 


FILE 


fpos t 


size t 


clearerr 


fclose 


fflush 


stderr 一 一 用 这 个 宏 来 指明 标准 错误 数据 流 。 
用 这 个 宏 来 指明 标准 输入 流 。 
用 这 个 宏 来 指明 标准 输出 流 。 

FITE 一 一 可 以 声明 一 个 指向 FILE 的 指针 来 存储 成 功 调用 函数 fopen 或 
freopen 的 返回 值 。 然 后 可 以 将 这 个 值 作为 对 数据 流 进行 操作 的 各 个 函数 的 
参数 。 然 而 ， 程 序 员 不 能 声明 FILE 类 型 的 数据 对 象 。C 标准 库 提供 了 所 有 
这 样 的 对 象 。 要 把 FILE 类 型 的 数据 对 象 的 内 容 作为 一 个 黑箱 子 对 待 ， 使 用 
<stdio.h> 中 声明 的 函数 来 对 它 的 内 容 进 行 操作 。 

fpos 上 t 一 一 这 是 函数 fgetpos 的 返回 值 类 型 。 它 可 以 代表 任意 文件 的 任 
意 文件 定位 符 。 这 说 明 可 以 复制 这 个 值 ， 也 可 以 把 它 作为 质数 调用 中 的 一 个 
参数 来 传递 ， 但 是 不 能 对 它 进行 算术 运算 。 将 这 个 值 传 给 晴 数 fsetpos LE 
在 保存 的 位 置 点 上 重新 定位 文件 。 注 意 ， 较 老 的 明 数 ftell 和 fseek 能 够 执 
行 相同 的 操作 ， 但 对 某 些 文件 〈 尤 其 是 大 文件 ) 也 可 能 失败 。 无 论 在 什么 情 
况 下 尽 可 能 使 用 肾 数 fgetpos 和 fsetpos。 
参考 11.3 节 。 

使 用 这 个 也 数 来 清除 流 中 的 文件 结束 符 和 错误 指示 符 。 当 
HAV EH pA feof 或 ferror 时 才 需 要 使 用 这 个 函数 。 

fclose— —lI RB "Tea fopen 打开 了 一 个 文件 ， 那 么 随后 就 可 能 调 
用 函数 fclose 来 关闭 它 。 一 个 对 任意 数 日 文件 进行 操作 的 程序 可 能 超过 允许 同 
时 打开 的 文件 数目 的 最 大 值 。( 参 见 上 面 讲 的 FOPEN MAX.) 程序 终止 时 ，C bn 
准 库 将 关闭 仍然 处 于 打开 状态 的 所 有 文件 。 这 是 关闭 3 种 标准 流 的 常用 方式 。 

feof 一 一 大 多 数 读 取 流 的 函数 会 返回 一 个 特定 的 值 ， 例 如 EOF， 来 指示 
读 操作 已 到 达 文 件 结尾 。 如 果 错 过 了 这 个 测试 的 机 会 ， 则 使 用 函数 feof. € 
会 报告 一 个 流 的 文件 结束 符 的 状态 。 如 果 这 个 指示 符 显 示 地 将 文件 定位 符 
从 文件 结尾 移 去 ， 那 么 文件 定位 请 求 命 令 将 会 清除 这 个 指示 符 。 对 于 函数 
clearerr 的 调用 也 是 如 此 。 

对 一 个 流 的 读 或 写 操作 会 因为 各 种 原因 而 失败 。 流 中 的 
错误 指示 符 将 会 记录 所 有 这 些 失 败 。 要 检查 是 否 有 错误 发 生 ， 需 调用 函数 
ferror. HH clearerr 或 rewind 将 会 清除 这 个 指示 符 。 

ff lush 一 一 可 以 对 一 个 流 调 用 函数 ff1lush 来 确保 流 中 没有 保留 缓冲 
输出 。 如 果 向 一 个 输出 流 写 提示 信息 且 从 一 个 输出 流 读 取 响应 ， 这 个 操作 
可 能 很 重要 。 要 确保 与 用 户 知 道 程序 期 望 的 下 一 个 动作 是 什么 。 调 用 函数 
fflush (NULL) 来 清空 所 有 的 输出 流 ， 这 也 为 程序 随后 的 失去 控制 做 好 了 准 
备 。( 这 个 程序 可 能 即将 执行 未 调试 的 代码 ， 或 者 可 能 仅仅 是 引导 使 用 者 关 
闭 计算 机 。) 在 程序 终止 时 C 标准 库 清 空 所 有 的 输出 流 。 


stdin 


stdout 


size_t 


clearerr 


ferror 
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fgetc 


fgetpos 


fgets 


fopen 


fprintf 


fputc 


fputs 


fread 


freopen 


fscanf 


fseek 


fgetc— — Ha] HI 30 A eR OM i A it AKTET — T GAV AT 
面 “函数 fgetc” 部 分 )。 所 有 读 取 流 的 函数 的 行为 就 像 他 们 连续 调用 函数 
fgetc 来 获得 每 一 个 字符 。getc 与 fgetc 有 相同 的 说 明 ， 但 是 它 可 能 有 一 个 
可 以 极 大 地 改善 性 能 的 屏 项 宏 。 因 此 ， 通 常 应 该 使 用 getc 而 不 用 fgetc。 

fgetpos 一 一 使 用 这 个 函数 来 记录 文件 中 以 后 可 能 想 返 回 的 位 置 。 它 返 
回 一 个 fpos_ 上 类 型 的 值 ， 该 类 型 在 上 面 有 描述 。 

fgets 一 一 使 用 这 个 函数 从 一 个 流 中 读 取 文 本 行 。 当 读 入 并 存储 了 一 个 
换行 符 或 指定 的 缓冲 区 已 满 时 ， 它 就 停止 读 取 。 任 何 成 功 读 取 之 后 ， 缓 冲 区 
的 内 容 是 以 空 字符 结尾 的 。 不 要 使 用 函数 gets KARN. 

fopen 一 一 用 这 个 隧 数 打开 一 个 文件 。 从 本 节 的 “打开 文件 ”部 分 开始 
就 详细 讨论 了 这 个 顺 数 。 使 用 责 数 freopen 来 重 定向 一 个 标准 流 。 

fprintf 一 一 这 是 一 个 格式 化 输出 陆 数 ， 它 将 输出 内 容 写 到 指定 的 输出 
流 中 。 参 考 从 本 节 的 “格式 化 输出 ”部 分 开始 的 描述 。 

fputc 一 一 调用 这 个 明 数 将 一 个 字符 写 到 输出 流 中 《参考 本 节 的 “ 师 数 
fputc” 部 分 )。 对 一 个 流 进行 写 操 作 的 所 有 其 他 质数 的 行为 就 像 他 们 可 以 调用 
函数 fputc 来 传递 每 一 个 字符 。putc 与 Eputc 有 相同 的 说 明 ， 但 是 它 更 可 能 有 
一 个 可 以 极 大 地 改善 性 能 的 屏蔽 安 。 因 此 ， 通 常 应 该 使 用 pute 而 不 是 fputc。 

fputs 一 一 使 用 这 个 函数 将 字符 从 以 空 字符 终止 的 字符 串 写 到 一 个 流 中 。 
Hø puts ABB), PR fputs 不 会 将 一 个 换行 符 附加 到 它 写 的 任何 内 容 后 
面 。 这 对 汇编 文本 行 或 写 二 进 制 数据 更 有 用 。 

fread 一 一 使 用 这 个 两 数 将 二 进 制 数 据 读 和 人 一 个 数组 数据 对 象 中 或 是 从 
任意 数据 流 中 读 取 最 多 某 个 固定 数目 的 字符 。 如 果 参 数 size (第 二 个 ) 比 1 
大 ， 那 么 就 不 能 确定 这 个 函数 在 它 报告 的 字符 之 外 是 否 也 读 取 了 多 达 size-1 
个 额外 的 字符 。 通 常用 fread(buf,1,size*n, stream) 来 调用 也 数 比 用 
fread(buf,size,n,stream) 更 好 。 
只 有 当 要 重新 使 用 一 个 已 经 打开 的 数据 流 时 才 使 用 涌 数 
freopen。 例 如 ， 在 某 些 情况 下 ， 它 可 以 很 方便 地 将 stdin 或 stdout 重新 关 
联 到 一 个 不 同 的 文件 。 然 而 ， 大 多 情况 下 都 会 使 用 顺 数 fopen. 

fscanf 一 一 这 是 格式 化 输入 函数 ， 它 从 指定 的 输入 流 中 读 人 数据 。 参 考 
从 本 节 “ 格 式 化 输入 ”部 分 开始 的 描述 。 
使 用 这 个 陋 数 来 修改 一 个 数据 流 的 文件 定位 符 。 可 以 通过 
执行 offset=ftell(stream) 来 记录 文件 中 的 一 个 位 置 。 后 面 可 以 通过 执 
47 fseek (stream,offeet, SEEK CUR) 来 返回 那个 位 置 。fseek 在 二 进 
制 流 中 用 途 更 大 ， 在 这 种 情况 下 ， 参 数 offset (第 二 个 ) 是 文件 中 的 一 个 
long 类 型 且 以 字 节 为 单位 的 偏 移 量 。 参 数 mode (第 三 个 ) 必须 是 上 述 描述 的 
SEEK CUR, SEEK END 或 SEEK SET 中 的 一 个 。 


freopen 


fseek 
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fsetpos 


ftell 


fwrite 


perror 


fsetpos 一 一 用 这 个 函数 为 一 个 流 修改 文件 定位 符 。 它 的 参数 position 
(第 二 个 ) 必须 指向 一 个 fros t 类 型 的 数据 对 象 ， 而 该 类 型 是 对 同 据 流 前 面 
调用 函数 fgetpos 时 设置 的 。 参 考 上 面 对 fpos_t 的 讨论 。 

ftel1 一 一 用 这 个 函数 记录 文件 中 以 后 想 要 恢复 的 位 置 。 它 返回 一 个 
long 类 型 的 值 ， 该 值 适用 于 以 后 对 函数 £seek 的 调用 。 

fwrite 一 一 用 这 个 函数 将 一 个 数组 数据 对 象 中 的 二 进 制 数 据 或 者 一 个 定 
长 的 字符 串 写 到 任意 流 中 。 如 果 参 数 size (第 二 个 ) 的 值 大 于 1， 则 无 法 确 
定 在 写 出 错 之 前 该 函数 是 否 写 了 多 达 size1 个 额外 的 字符 。 写 出 错 通常 极 
少 发 生 ， 所 以 这 不 是 一 个 主要 的 缺陷 。 

getc 一 一 用 这 个 函数 代替 函数 £gete, SÆ Å fgetc。 

getchar—— xx Æ PRN getc (stdin) 的 一 种 便利 的 简写 方式 。 这 两 个 函 
数 的 调用 生成 等 价 的 代码 。 

gets 一 一 避免 使 用 这 个 函数 ， 因 为 无 法 限制 该 函数 读 人 字符 的 数目 。 用 
函数 fgets 代替 它 。 

pertror 一 一 用 这 个 函数 向 标准 错误 流 写 单行 出 错 信 息 ， 该 信息 描述 了 存 
储 在 errno 中 的 当前 出 错 代码 。( 参 考 第 3 章 。) 如 果 想 对 出 错 信息 的 显示 方 
式 进 行 更 多 的 控制 ， 则 调用 <string.h> PAR KP strerror 来 代替 它 。 

printft 一 一 这 是 格式 化 输出 函数 ， 它 向 标准 输出 流 写 数据 。 该 函数 是 使 
用 最 广泛 的 打印 函数 ， 参 考 上 面 的 消 数 fprintf, 

putc 一 一 用 这 个 函数 代替 函数 fputc。( 见 fputc。) 

putchar— —putchar (ch) Æ pA putc (ch, stdout) 的 一 种 便利 的 简写 
方式 ， 这 两 个 函数 调用 生成 等 价 的 代码 。 

puts 一 一 用 这 个 函数 将 字符 从 一 个 以 空 字符 终止 的 字符 串 写 到 一 个 流 
中 。 该 函数 将 一 个 换行 符 附 加 到 它 写 的 任意 数据 中 。 姐 果 不 希 望 附 加 换行 符 ， 
则 用 函数 fputs。 

remove 一 一 该 函数 实现 从 一 个 文件 系统 中 删除 一 个 文件 。 以 后 用 同一 
XT A XT PRÉC fopen 调用 将 无 法 找到 存在 的 文件 。 它 是 删除 通过 调用 函数 
tmpnam 生成 的 文件 名 新 建 的 任意 文件 的 好 方式 。 

rename 一 一 这 个 函数 实现 文件 的 重 命名 。 后 面 对 函 数 fopen 的 调用 将 找 
不 到 一 个 以 旧 文 件 名 命名 的 文件 ， 但 能 够 成 功 找到 一 个 以 新 文件 名 命名 的 文 
件 。 有 时 可 以 简单 地 通过 重 命名 一 个 临时 文件 来 实现 对 它 的 永久 保持 。 然 而 ， 
rename 不 会 复制 文件 内 容 来 使 重 命 名 生效 。 要 通过 检测 函数 返回 值 来 看 操作 
是 否 成 功 。 

rewind 一 一 不 同 于 其 他 文件 定位 函数 ， 也 数 rewind 为 一 个 流 清除 错误 
指示 符 ， 它 也 报告 没有 错误 。 如 果 需 要 ， 可 以 使 用 函数 fseek(stream,0, 


SEEK SET) 和 clearerr (stream) 代替 它 。 


scanf 


setbuf 


setvbuf 


sprintf 


sscanf 


tmpfile 


ungetc 


vfprintf 


vprintf 


vsprintf 
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scanf 一 一 这 是 格式 化 的 输入 了 滑 数 ， 它 从 标准 输入 流 中 读 取 数据 。 该 函 
数 是 使 用 最 广泛 的 输入 函数 。 

setbuf 一 一 用 setvbuf 代替 这 个 函数 以 获得 更 多 的 控制 。 

setvbuf 一 一 通常 ， 最 好 让 C 标准 库 决 定 如 何 缓冲 输入 / 输出。 如 果 确 
定 不 使 用 缓冲 或 一 次 一 行进 行 缓冲 ， 则 用 这 个 了 消 数 对 流 进行 合适 的 初始 化 。 
打开 某 个 流 之 后 立即 调用 函数 setvbuf。 几 乎 对 流 的 任意 操作 都 会 抢 在 用 户 
之 前 选择 一 个 缓冲 策略 。 如 果 用 户 在 这 次 调用 中 指定 了 自己 的 缓冲 区 ， 流 可 
能 不 会 真正 去 使 用 它 。 而 且 当 流 打 开 时 ， 绝 不 要 改变 缓冲 区 的 内 容 。 参 数 
mode( 第 三 个 ) 必须 是 上 述 (oppe, _IOLBF 以 及 _IONBF 中 的 一 个 。 也 可 参 
考 上 面 描述 的 宏 BUFSIZ, 

sprintf 一 一 这 是 格式 化 的 输出 函数 ， 它 将 一 个 以 空 字 符 终止 的 字符 串 
写 到 指定 的 缓冲 区 中 。 它 是 允许 将 已 编码 的 值 转换 成 文本 而 不 用 写 到 一 个 流 
的 唯一 方式 。 注 意 不 能 直接 限定 函数 sprintf 存储 的 最 大 字符 数 。 转 换 时 要 
小 心 ， 因 为 它 可 能 生成 足够 的 字符 而 使 存储 超出 了 缓冲 区 的 边界 。 参 考 珊 数 
fprintf, ` 

sscanf 一 一 这 是 格式 化 的 输入 函数 ， 它 从 指定 的 缓冲 区 中 读 取 一 个 以 空 
字符 终止 的 字符 串 。 可 以 使 用 它 以 多 种 不 同 的 格式 扫描 同一 字符 序列 ， 直 到 
找到 一 个 成 功 的 扫描 。 

tmpfile— 一 在 任何 情况 下 尽 可 能 用 函数 tmpf ile 代替 函数 tmpnam。 
前 者 用 来 打开 一 个 文件 并 在 程序 终止 时 关闭 和 删除 该 文件 。 后 者 要 求 手 动 实 
现 更 多 的 功能 。 

tmpnam 一 一 只 有 当 函 数 hmpfile 不 能 满足 用 户 需求 时 ， 才 用 这 个 函数 
获得 一 个 或 更 多 的 临时 文件 名 。 例 如 ， 想 以 一 种 不 同 于 "wb+ " 的 模式 打开 文 
件 。 也 可 能 需要 不 断 地 打开 和 关闭 同一 个 文件 。 或 是 想 在 程序 终止 之 前 给 文 
件 重 命名 。 参 考 上 述 的 宏 TMP MAX. 

ungetc- 一 -这 个 商 数 只 能 与 读 函 数 结合 使 用 。 现 数 ungetc 与 文件 定位 
函数 的 相互 作用 是 微弱 的 。 可 以 使 一 个 不 是 最 后 读 入 的 字符 回 退 ， 甚 至 可 以 
使 文件 开始 的 一 个 字符 回 退 。 但 是 不 能 在 各 个 读 函 数 的 调用 之 间 方 便 地 回 退 
多 个 字符 。 

vfprintf 一 一 用 这 个 消 数 构建 函数 fprintf 的 特殊 版 本 ， 本 节 前 面 有 
描述 。 

verintf 一 一 用 这 个 函数 构建 郧 数 printf 的 特殊 版 本 ， 本 节 前 面 有 描述 。 


vsprintf 一 一 用 这 个 函数 构建 随 数 sprintf 的 特殊 版 本 ， 本 节 前 面部 分 
A. 
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12.4 <stdio.h> 的 实现 


头 文件 


<stdio.h> 


类 型 FILE 


getc 
putc 


有 两 种 设计 决策 对 于 <stdio.h> 的 实现 非常 关键 : 

O 数据 结构 FILE 的 内 容 ; 

D 与 操作 系统 相互 作用 以 执行 实际 输入 /输出 的 低级 原 语 。 
这 一 部 分 先 详细 讨论 这 两 个 话题 ， 然 后 再 讨论 低级 VO 函数 的 工作 方式 ， 最 
后 描述 格式 化 输入 输出 函数 。 

图 12-2 显示 了 文件 staio.h。 现 在 读者 应 该 能 够 熟练 使 用 内 部 头 文件 
«yvals.ho 来 支持 依赖 实现 的 参数 。 

下 面 是 <yvals.h> 中 定义 的 会 影响 <stdio.h> 的 一 些 参数 ， 给 这 些 参数 
赋予 了 某 些 合理 的 值 


#define _NULL (void *)0 /* value for NULL */ 
#define  FNAMAX 64 /* value for FILENAME MAX */ 
#define FOPMAX 32 /* value for FOPEN MAX */ 
#define _TNAMAX 16 /* value for L tmpnam */ 


文件 stdio.h 包含 其 他 一 些 神秘 的 东西 ， 现 在 是 揭 并 它们 面纱 的 时 候 
了 。 首 先 集 中 讨论 一 下 类 型 FILE 的 定义 。 它 的 成 员 包 括 以 下 几 个 。 

D _Mode 一 一 流 的 状态 位 集合 ， 下 面 有 它 的 定义 。 

O _Handle 一 一 操作 系统 为 打开 文件 返回 的 句柄 或 文件 描述 符 。 


O _Buf 一 一 指向 流 缓冲 区 首 地 址 的 指针 ， 如 果 没 有 分 配 缓 冲 区 ， 则 是 
一 个 空 指针 。 
D _Bend 一 一 指向 超出 缓冲 区 的 第 一 个 字符 的 指针 ， 如 果 But 是 一 个 


空 指 针 ， 则 它 没有 定义 。 


D _Next 一 指向 读 操作 或 写 操作 的 下 一 个 字符 的 指针 ， 它 不 可 能 是 一 
个 空 指针 。 

O _Reng 一 指向 超出 读 取 数 据 范围 的 第 一 个 字符 的 指针 ， 它 不 可 能 ; 
一 个 空 指针 。 


D _Rsave 一 一 如 果 字 符 回 退 ， 则 保存 指针 Rena. 
D _wenad 一 一 指向 超出 可 写 数据 范围 的 第 一 个 字符 ， 它 不 可 能 是 一 个 空 


指针 。 
O _Back 一 一 保存 回 退 字符 的 栈 。 
O _Cbuf 一 一 当 没 有 其 他 缓冲 区 可 用 时 ， 能 够 使 用 的 单字 符 缓冲 区 。 
O _Nback 一 一 记录 回 退 字符 个 数 。 


口 


_Tmpnam 一 一 指向 文件 关闭 时 要 删除 的 临时 文件 名 的 指针 ， 或 一 个 空 指针 。 

数据 结构 FILE 的 设计 要 受到 宏 gete 和 pute (H getchar 5j putchar) 
的 需要 的 驱动 。 这 些 宏 都 展开 为 一 个 条 件 表 达 式 ， 这 个 表达 式 可 以 直接 访 
问 流 缓 冲 区 或 者 调用 底层 函数 。 条 件 表达 式 的 判断 部 分 必须 简单 并 且 总 能 够 
安全 执行 。 这 样 ， 如 果 可 读 人 的 字符 在 指针 str 所 指 的 流 的 缓冲 区 中 ， 那 么 
str-> Next<str-> Rend 总 是 为 真 。 另 外 ， 如 果 可 在 缓冲 区 内 获得 空间 将 


头 文件 


"xstdio.h" 


模式 指示 符 
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字符 写 到 流 中 ， 那 么 str-> Next<str-> wena 总 是 为 真 。 例 如 ， 形 如 str- 
> Wend-str-» Buf 的 表达 式 不 允许 将 数据 从 这 些 宏 写 到 缓冲 区 内 。 

进行 读 或 写 流 操 作 时 调用 的 函数 构建 了 更 详细 的 测试 。 例 如 ， 一 个 读 函 
数 能 区 分 多 种 条 件 ， 例 如 : 字符 是 可 用 的 、 当 前 缓冲 区 已 耗 尽 、 到 达 文 件 结 
柬 处 、 还 没有 分 配 缓冲 区 、 当 前 不 允许 读 并 且 禁 止 读 操作 。 这 些 函 数 很 大 程 
度 上 依靠 成 员 _Mode 中 的 各 种 指示 符 来 进行 区 分 。 

只 有 C 标准 库 内 部 的 函数 才 关 心 这 些 指示 符 的 含义 。 击 于 这 个 以 及 其 
他 的 原因 ， 我 创建 了 内 部 头 文件 "xstaio.h"。 这 音 描 述 的 所 有 函数 都 包括 
"xstdio.h"， 它 为 流 模 式 指 示 符 定义 了 宏 。 该 内 部 头 文件 包括 了 <stdio.h> 
并 声明 了 用 于 实现 <stdio.h> 的 属性 的 所 有 内 部 函数 ， 同 时 定义 了 许多 宏和 
只 与 格式 化 输入 输出 隧 数 有 关 的 类 型 。 

j <stdio.h> 不同, 头 文件 "xstdio.h" 包含 了 太 多 琐碎 的 东西 ， 不 能 
在 这 里 一 一 介绍 。 我 会 在 用 到 它 的 地 方 对 它 进行 说 明 ， 然 后 在 图 12-57 给 出 
了 它 的 完整 文件 。 例 如 ， 这 里 给 出 了 成 员 Mode 中 各 种 指示 符 的 宕 名 。 每 个 
宏 被 定义 成 一 个 具有 不 同位 集 的 值 ， 就 像 在 0x1、0x2、0x4、0x8 中 等 等 。 因 
为 实际 的 值 不 重要 ， 所 以 在 这 里 省 略 了 这 些 值 。 

O _MOPENR 一 一 若 文 件 是 打开 用 来 读 的 ， 则 设置 它 。 

O _MOPENW 一 一 若 文 件 是 打开 用 来 写 的 ， 则 设置 它 。 

O _MOPENA 一 一 若 所 有 的 写 操作 添加 到 文件 结尾 ， 则 设置 它 。 

D _MTRUNC 一 一 车 已 存在 的 文件 在 打开 (打开 后 不 使 用 〉 时 被 截 短 了 ， 
则 设置 它 。 
_MCREAT 一 一 若 一 个 新 的 文件 在 打开 (打开 后 不 使 用 ) 时 可 以 被 创 
建 ， 则 设置 它 。 
_MBIN- 一 若 流 是 二 进 制 的 则 设置 它 ， 若 流 被 解释 为 文本 则 不 要 设置 它 。 
-MALBUF 一 一 若 缓 冲 区 在 关闭 时 必须 释放 ， 则 设置 它 。 
_MALFIL——#% FILE 类 型 的 数据 对 象 在 关闭 时 必须 释放 ， 则 设置 它 。 
_MEOF 一 一 文件 结束 指示 符 。 - 
_MERR 一 一 错误 指示 符 。 
_MLBF 一 一 若 行 缓冲 有 效 ， 则 设置 它 。 
_MNBF 一 一 若 不 出 现 缓冲 ， 则 设置 它 。 
_MREAD 一 一 若 在 上 一 个 文件 定位 操作 之 后 出 现 了 一 个 读 操作 ， 则 设置 它 。 
D _MWRITE 一 一 若 在 上 一 个 文件 定位 操作 之 后 出 现 了 一 个 写 操 作 ， 则 设置 它 。 
这 些 宏 都 有 私有 的 名 字 一 一 以 一 个 下 划 线 和 一 个 大 写字 母 开 头 一 一 尽管 
不 一 定 要 这 样 写 。 当 我 开发 库 的 时 候 ， 我 经 常 将 它们 移 人 移出 <stdio.h>, 
某 些 对 用 户 程序 可 见 的 宏 使 用 了 这 些 宏 名 ， 但 后 来 的 版 本 又 不 使 用 了 。 最 
后 ， 为 了 安全 ， 我 将 这 些 宏 名 保留 为 这 种 形式 。 用 户 可 能 偶尔 会 引入 操作 成 
Å Mode 中 的 指示 符 的 宏 。 


口 


Qaodaauuàlu 
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图 12-2 /* stdio.h standard header */ 
stdio.h #ifndef _STDIO 
#define _STDIO 
#ifndef _YVALS 
#include <yvals.h> 


Hendif 

/* macros */ 
#define NULL NULL 
#define  IOFBF 0 
#define  IOLBF 工 
#define _IONBF 2 
#define BUFSIZ 512 
#define EOF -1 
#define FILENAME MAX ..FNAMAX 
#define FOPEN MAX ..FOPMAX 
#define L tmpnam _TNAMAX 
#define TMP_MAX 32 
#define SEEK_SET 0 
#define SEEK CUR 1 
#define SEEK END 2 
fidefine stdin .Files[0] 
fidefine stdout  Files[1] 
#define stderr  Files(2] 


/* type definitions */ 
#ifndef  SIZET 
#define _SIZET 
typedef _Sizet size_t; 
#endif 
typedef struct { 
unsigned long Off; /* system dependent */ 
} fpos t; 
typedef struct ( 
unsigned short Mode; 
short | Handle; 
unsigned char * Buf, * Bend, * Next; 
unsigned char * Rend, * Rsave, * Wend; 
unsigned char _Back[2] , _Cbuf,  Nback; 
char * Tmpnam; 
) FILE; 

/* declarations */ 
void clearerr (FILE *); 
int fclose(FILE *); 
int feof (FILE *); 
int ferror(FILE *); 
int fflush(FILE *); 
int fgetc(FILE *); 
int fgetpos(FILE *, fpos t *) ; 
char *fgets (char *, int, FILE *) ; 

FILE *fopen(const char *, const char *); 

int fprintf (FILE *, const char *, . . .); 

int fputc (int, FILE *); 

int fputs (const char *, FILE zi: 

size t fread (void *, size t , size t , FILE *); 
FILE *freopen(const char *, const char *, FILE *); 
int fscanf(FILE *, const char *, . . . ) ; 
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图 12-2 int fseek(FILE *, long, int); 
WA int fsetpos(FILE *, const fpos t ai: 
long ftell(FILE *); 
Size t fwrite(const void *, size t, size t, FILE *); 
int getc(FILE *); 
int getchar(void); 
char *gets(char *); 
void perror(const char *); 
int printf(const char *,...); 
int putc(int, FILE *); 
int putchar(int ); 
int puts(const char *); 
int remove(const char *); 
int rename(const char *, const char *); 
void rewind(FILE *); 
int scanf (const char *,...); 
void setbuf(FILE *, char *); 
int setvbuf(FILE *, char *, int, size t); 
int sprintf(char *, const char *, ...); 
int sscanf(const char *, const char *, ...); 
FILE *tmpfile(void); 
char *tmpnam(char zi: 
int ungetc(int, FILE *); 
int vfprintf(FILE *, const char *, char *); 
int vprintf(const char *, char *); 
int vsprintf(char *, const char *, char *); 
long . Fgpos(FILE *, fpos t *); 
int _Fspos (FILE *, const fpos t *, long, int); 
extern FILE * Files[FOPEN MAX]; 
/* macro overrides */ 
#define fgetpos (str, ptr) (int) Fgpos(str, ptr) 
#define fseek(str, off, way) _Fspos(str , NULL, off, way) 
#define fsetpos(str, ptr) _Fspos(str, ptr, OL, 0) 
fidefine ftell(str)  Fgpos(str, NULL) 


#define getc(str) ((str)-» Next < (str)-> Rend \ 
? *(str)-> Next++ : (getc)(str)) 
#define getchar() ( Files[0]-» Next < Files[0]-> Rend \ 
? * Files[0]-> Next++ : (getchar) ()) 
#define putc(c, str) ((str)-» Next < (str)-» Wend \ 
? (*(str)-» Next++ = c) : (putc)(c, str)) 
#define putchar(c) ( Files[1]-» Next < Files[l]-> Wend \ 
? (* Files[1]-» Next++ = c) : (putchar) (c)) 
fendif D 


这 些 指 示 符 实际 上 是 两 个 集合 的 并 集 , 一 个 是 决定 如 何 打开 文件 的 指示 
符 的 集合 ， 另 一 个 是 帮助 记录 数据 流 状态 的 指示 符 的 集合 。 由 于 这 两 个 集合 
有 部 分 重 肆 ， 所 以 我 选择 把 它们 全 部 放 在 一 个 位 编码 “空间 ”中 。 一 个 更 整 
洁 的 实现 可 能 会 把 这 两 种 用 法 分 开 。 如 果 Mode 中 的 位 特别 少 ， 也 会 定义 
两 个 数值 的 集合 。 无 论 哪 种 情况 ， 都 必须 添加 代码 以 在 两 种 表示 之 间 进 行 
换 。 
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Files 
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观察 库 如 何 使 用 一 个 FILE 类 型 数据 对 象 的 最 好 方法 是 在 它 的 整个 生命 
期 中 跟踪 它 。 图 12-3 显示 了 文件 fopen.c， 它 定义 了 函数 fopen， 可 以 通过 
文件 名 调用 它 来 打开 一 个 文件 。 该 函数 首先 寻找 一 个 空闲 的 项 ， 该 项 存储 在 
TOR A FILE 类 型 指针 的 静态 数组 Files 中 ， 它 包含 了 FOPEN_MAX 个 元 素 。 
如 果 所 有 这 些 指针 指向 的 都 是 已 打开 的 文件 的 FILE 类 型 的 数据 对 象 ， 那 么 
随后 的 所 有 打开 请 求 都 会 失败 。 


/* fopen function */ 
#include <stdlib.h> 
#include "xstdio.h" 


FILE *(fopen)(const char *name, const char *mods) 
{ 
FILE *str; 
size_t i; 


/* open a file */ 


for(i = 0; i < FOPEN_MAX; ++i) 
if(_Files[i] == NULL) 
{ /* setup empty _Files[i] */ 
str = malloc (sizeof (FILE)); 
if (str == NULL) 
return (NULL) ; 
_Files[i] = str; 
str->_Mode = _MALFIL; 
break; 
} 
else if (_Files[i]->_Mode == 0) 
{ /* setup preallocated  Files[i] */ 
str - Files[i]; 
break; 
H 
if (FOPEN MAX <= i) 
return (NULL); 
B return ( Foprep(name, mods, str)); 


} 


图 12-4 显示 了 定义 Files 类 型 数据 对 象 的 文件 x6les.c。 该 对 象 为 3 
个 标准 流 定义 了 FIIE 类 型 数据 对 象 的 静态 实例 。 每 个 实例 通过 合适 的 参数 
被 初始 化 为 打开 状态 。 在 处 理 过 程 中 ， 我 用 0 代表 标准 输入 ，1 代表 标准 输 
出 ，2 代表 标准 出 错 。 这 是 一 个 被 广泛 使 用 的 惯例 ， 是 从 UNIX 中 继承 过 来 
的 ， 用 户 可 能 需要 改变 或 映射 这 些 值 或 图 。 


Files 中 的 第 四 个 以 及 后 面 的 元 素 被 初始 化 为 空 指针 。 如 果 函 数 
fopen 发 现 其 中 的 一 个 元 素 ， 那 么 它 就 分 配 一 个 FILE 类 型 的 数据 对 象 并 且 
FEE rh AURE. SR fopen 通过 观察 Files 的 一 个 非 空 元 素 
来 发 现 一 个 关闭 的 标准 流 ， 这 个 元 素 指向 成 员 Mode 为 零 的 FILE 类 型 数 
据 对 象 。 
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图 12-4 


xfiles.c 


FÅ freopen 


图 12-5 


freopen.c 


if fclose 


函数 Foprep 


/* Files data object */ 
#include "xstdio.h" 


/* standard error buffer */ 
Static unsigned char ebuf [80]; 


/* the standard streams */ 

static FILE sin = ( /* standard input */ 
.MOPENR, 0, 
NULL, NULL, &sin. Cbuf, 
&sin. Cbuf, NULL, &sin. Cbuf,); 

static FILE sout = ( /* standard output */ 
_MOPENW, 1, 
NULL, NULL, &sout._Cbuf, 
&sout. Cbuf, NULL, &sout. Cbuf,); 

static FILE serr = ( /* standard error */ 
.MOPENW| MNBF, 2, 
ebuf, ebuf + sizeof(ebuf), ebuf, 
ebuf, NULL, ebuf,}; 


/* the array of stream pointers */ 
FILE * Files[FOPEN MAX] = (&sin, &sout, &serr); 口 


fopen #4] FH REPRE. _Foprep 来 完成 打开 文件 的 过 程 。 图 12-5 显示 了 
文件 freopen.c. PARK freopen 也 调用 这 个 内 部 函数 。 注 意 在 珊 数 fclose 
关闭 与 当前 流 关联 的 文件 之 前 ， 它 是 如 何 记录 指示 符 MALFIL PRISET. PR 
数 £reopen Ar THER fclose 执行 的 一 个 操作 是 释放 FILE 类 型 数据 对 象 。 


/* freopen function */ 
#include <stdlib.h> 
#include "xstdio.h" 


FILE *(freopen) (const char *name, const char *mods, FILE *str) 
H /* reopen a file */ 
unsigned short mode = str-» Mode &  MALFIL; 


str-> Mode &- - MALFIL; 
fclose(str); 


str-» Mode = mode; 
return( Foprep(name, mods, str)); 
} 口 


在 这 里 也 会 看 到 fclose。 图 12-6 显示 了 文件 fclose.c， 它 以 一 种 非 
常 明 显 的 方式 取消 文件 打开 了 滑 数 所 做 的 工作 。 其 中 巧妙 的 一 点 是 它 调用 了 晴 数 
_Fclose 来 关闭 和 流 关联 的 文件 。 


图 12-7 显示 了 定义 函数 Foprep 的 文件 xfoprep.c。 该 函数 解析 fopen 
或 freopen 的 参数 mods (第 二 个 )， 至 少 是 按照 它 所 能 理解 的 ， 并 相应 地 初 
始 化 FILE 类 型 的 数据 对 象 的 成 员 。 然 而 ， 最 后 它 必须 要 求 某 一 外 部 琴 数 来 
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完成 打开 文件 的 工作 。 函 数 Foprep 将 文件 名 、 编 码 指示 符 以 及 moads 的 值 
传 给 调用 Fopen 的 本 数 ， 下 面 非常 简短 地 描述 了 函数 _Fopen。 


图 12-6 /* fclose function */ ~] 
fclose.c |#include <stdlib.h> 
finclude "xstdio.h" 

#include "yfuns.h" 


int (fclose) (FILE *str) 


{ /*close a stream */ 
int stat = fflush(str); 


if(str->_Mode & _MALBUF) 
free(str->_Buf) ; 
str-> Buf = NULL; 
if(0 <= str-> Handle && _Fclose(str)) 
stat = EOF; 
if (str->_Tmpnam) 
{ /* remove temp file */ 
if (remove (str->_Tmpnam) ) 
stat = EOF; 
free (str->_Tmpnam) ; 
str->_Tmpnam = NULL; 
} 
str->_Mode 
str->_Next 


0; 

&str-> Cbuf; 

str-> Rend &str-» Cbuf; 

str-> Wend &str-» Cbuf; 

Str-» Nback - 0; 

if(str-» Mode &  MALFIL) 
{ /* find Files[i) entry and free */ 
size_t i; 


for(i = 0; i < FOPEN MAX; ++i) 


if( Files[i] == str) 
{ /* found entry */ 
.Files[i] = NULL; 
break; 
} 
free(str); 


} 


return(stat); 


} m 


Ip PREX Fclose 5 Fopen 是 支撑 <stdio.h> 与 外 部 联系 的 几 个 低级 层次 
中 的 第 一 层 ， 每 一 个 都 必须 为 C 标准 库 执行 一 个 标准 化 函数 ， 也 必须 便于 修 
改 以 适应 不 同 操作 系统 的 不 同 的 需要 。 这 个 实现 包含 了 9 个 <stdio.h> 中 的 
销 数 ， 它 们 必须 进行 修改 来 适应 每 一 个 操作 系统 。 其 中 有 3 个 是 标准 函数 : 
D remove 一 一 删除 一 个 已 命名 的 文件 ; 


D) rename 一 一 修改 一 个 文件 的 名 字 ; 
D tmpnam 一 为 一 个 临时 文件 构建 一 个 合理 的 名 字 。 
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图 12-7 /* _Foprep function */ 
xfoprep.c |#include "xstdio.h" 


/* open a stream */ 
FILE * Foprep(const char *name, const char *mods, 
i FILE *str) 
{ /* make str safe for fclose, macros */ 
str-> Handle -1; 
str-> Tmpnam = NULL; 
str-> Buf = NULL; 
str-> Next &str-> Cbuf; 
str-> Rend &str-> Cbuf; 
str-> Wend &str-» Cbuf; 
Str-» Nback - 0; 
str-> Mode - (str-> Mode &  MALFIL) 
| (*mods == "rr ? _MOPENR 
*mods 'w' ? | MCREAT|. MOPENW |. MTRUNC 
? |MCREAT | MOPENW |. MOPENA 
: 0); 
if((str-> Mode & ( MOPENR| MOPENW)) == 
{ bad mods */| 
fclose(str); 
return (NULL): 
) /* bad mods */ 
while(*++mods== 'b'|[*mods == '-*') 
if(*mods == 'b') 
if(str-> Mode & MBIN) 
break; 
else 
str-» Mode |= _MBIN; 
else 
if((str-» Mode & ( MOPENR |. MOPENW) ) 
==( MOPENR|. MOPENW) ) 
break; 
else 
str-» Mode |= | MOPENR| MOPENW; 
str-> Handle - Fopen(name, str-» Mode, mods); 
if(str-», Handle « 0) 
{ /* open failed */ 
fclose(str); 
return (NULL) ; 
} 
return (str); 


} 


这 些 函 数 都 很 小 而 且 很 大 程度 上 依赖 于 底层 操作 系统 的 特征 ， 所 以 不 值得 把 
它们 作为 更 低级 的 原 语 实现 。 通 常 可 以 在 已 有 的 C 库 中 找到 很 多 版 本 ， 它 们 

使 用 都 很 方便 。 
头 文件 有 3 个 原 语 是 定义 在 内 部 头 文件 "yxfuns hv 中 的 宏 ，3.4 节 中 就 提 到 了 这 
"yfuns.h" 个 头 文 件 。 它 定义 宏 并 声明 函数 ， 这 些 宏 和 顶 数 仅 在 C 标准 库 内 部 使 用 ， 作 
为 与 外 部 联系 的 接口 。 只 有 为 这 一 实现 所 编写 的 某 些 函数 需要 包括 "yfuns. 
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. Fclose 


_Fwrite 


_Fopen 


_Fgpos 


-Fspos 


h"。( 相 应 地 ， 内 部 头 文件 <yvals.h> 必须 包含 在 几 个 标准 头 文件 中 。) AB 3 
个 看 起 来 像 内 部 函数 的 宏 声 明 如 下 ; 


int _Fclose(FILE *str); 
int _Fread(FILE *str, char *buf, int size); 
int _Fwrite(FILE *str, const char *buf, int size); 


它们 的 语义 是 : 
O _Fclose 一 -关闭 与 指针 str 关联 的 文件 。 如 果 调用 成 功 ， 则 返回 零 。 
O _Fread 一 从 与 指针 str 关联 的 文件 中 将 最 多 size 个 字符 读 入 从 
buf 处 开始 的 缓冲 区 。 返回 成 功 读 人 的 字符 数 ， 若 在 文件 结束 处 则 返 
回 零 ， 若 发 生 读 错误 则 返回 一 个 负 的 错误 编码 。 
O _pwrite 一 将 size 个 字符 从 在 but 开始 的 缓冲 区 写 到 与 指针 str 
关联 的 文件 。 若 调用 成 功 则 返回 实际 写 人 的 字符 数 ， 若 发 生 写 错误 
则 返回 一 个 负 的 错误 编码 。 
许多 操作 系统 都 支持 声明 与 它们 非常 相似 的 函数 。 存 在 很 多 可 被 宏 展开 直接 
调用 的 函数 。 
最 后 3 个 原 语 是 内 部 函数 ， 其 中 一 个 函数 在 "xstdio.h" 中 声明 。 其 他 
两 个 用 在 屏蔽 宏 中 ， 因 此 在 <stdio.h> 中 声明 。 它 们 的 声明 如 下 : 


short _Fopen(const char *name, unsigned short mode, 
const char *mods); 
long  Fgpos(FILE *str, fpos t *fpos); 
int _Fspos(FILE *str, const fpos t *fpos, long offset, int way); 


它们 的 语义 如 下 : l 
O _Fopen 一 一 通过 文件 名 name 和 模式 mode (也 可 能 使 用 串 mods) FJ 
开 文 件 。 如 果 调 用 成 功 则 返回 一 个 非 负 的 句柄 。 
O Fotos 如 果 fpos 不 是 一 个 空 指 针 ， 就 将 文件 定位 符 存储 在 
Coos 中 并 返回 零 。 否 则 ， 将 文件 定位 符 编 码 使 之 成 为 一 个 long 类 型 
的 值 并 返回 它 的 值 。 若 调用 失败 则 返回 BOF 的 值 。 
Zt way 的 值 为 SEEK SET， 则 根据 fpos ak offset 设置 
文件 定位 符 。( 如 果 fpos 不 是 一 个 空 指针 ， 则 使 用 存储 在 fpos 中 
的 值 。 和 否则 通过 给 offset 解码 决定 文件 定位 符 。) 如果 way 的 值 为 
SEEK_CUR， 那 么 使 文件 定位 符 加 上 offset 的 值 。 否 则 way 的 值 一 
定 是 SEEK_END， 此 时 将 文件 定位 符 设 置 到 文件 的 最 后 一 个 字符 之 后 
然后 加 上 offset。 如 果 成 功 ， 则 返回 零 并 清除 ve, _MREAD 和 
 MWRITE; TIIA EME EOF. 
很 少 能 发 现 一 些 现 有 的 函数 ， 它 们 能 用 来 实现 这 3 PPAR RS AB, Å 
为 每 一 个 函数 都 用 到 了 特 属 于 这 个 实现 的 数据 表示 。 
附录 A 讨论 了 这 些 和 其 他 的 接口 原 语 。 它 讨论 了 如 何 将 这 个 库 与 几 个 常 


O _Fspos 
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UNIX 原 语 


图 12-8 


remove.c 


Er rename 


图 12-9 
rename.c 


用 的 操作 系统 配合 使 用 。 为 了 保持 完整 性 ， 本 章 给 出 了 一 种 环境 下 用 到 的 所 
有 原 语 。 但 是 请 记 住 ， 它 们 只 是 很 多 选择 中 的 一 种 。 


这 里 我 简单 地 描述 了 和 UNIX 操作 系统 的 很 多 版 本 通信 使 用 的 原 语 。 这 
通常 是 作为 C 标准 库 的 宿主 环境 使 用 的 最 简单 的 系统 。 即 使 C 语言 已 经 移植 
到 了 很 多 其 他 环境 下 ， 但 是 库 的 设计 的 很 多 方面 都 是 以 UNIX 的 需要 和 功能 
为 原型 的 。 我 给 出 的 文件 只 是 最 基本 的 ， 它们 可 以 在 很 多 方面 被 扩充 。 


所 有 情况 下 ， 都 假设 存在 执行 UNIX 系统 调用 的 C 可 调用 函数 ， 它 们 不 
会 和 标准 C 的 命名 空间 限制 发 生 冲 突 。 这 里 使 用 常规 的 UNIX 名 字 ， 以 一 个 
下 划 线 加 一 个 大 写字 母 开 头 。 因 此 ，unlink 就 变 成 了 _Unlink。 如 果 使 用 的 
UNIX 系统 不 支持 足够 的 替代 函数 ， 则 可 能 需要 使 用 汇编 语言 编写 这 些 函 数 。 


例如 ， 图 12-8 显示 了 文件 remove.c， 它 定义 了 函数 remove。 这 个 版 本 
只 是 简单 地 调用 UNIX 系统 调用 _Unlink。 一 个 更 严密 的 版 本 应 该 确保 具有 
超级 用 户 权 限 的 程序 不 会 轻易 地 执行 某 些 操作 。 


/* remove function -- UNIX version */ 
#include "xstdio.h" 


/* UNIX system call */ 
int Unlink(const char *); 


int (remove) (const char *fname) 
( /* remove a file */ 
returní( Unlink(fname)); 

) D 


图 12-9 显示 了 文件 rename.c， 它 定义 了 rename 的 一 个 简单 的 版 本 。 该 
铺 数 只 执行 对 文件 的 连接 。 这 就 要 求 新 文件 名 和 昌文 件 名 位 于 同一 个 文件 系 
统 内 (在 同一 个 逻辑 磁盘 分 区 上 )。 一 个 更 好 的 版 本 可 能 会 选择 在 Link 系统 
服务 失败 的 时 候 复制 一 个 文件 。 


/* rename function -- UNIX version */ 
#include "xstdio.h" 


/* UNIX system calls */ 
int _Link(const char *, const char zi: 
int Unlink(const char *); 


int (rename) (const char *old, const char *new) 
{ /* rename a file */ 
return( Link(old, new) ? -1 :  Unlink(old)); 
) . D 
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函数 tmpnam 图 12-10 显示 了 文件 tmpnam.c， 它 定义 了 tmpnam 的 一 个 简单 的 版 本 。 
PRE BOR / tmo 下 创建 一 个 临时 文件 名， 这 个 目录 是 通常 存在 临时 文件 
' 的 地 方 。 它 对 当前 的 进程 id 进行 编码 ， 使 每 一 个 控制 线程 都 对 应 名 字 列 表 中 
的 一 个 唯一 的 名 字 。 


图 12-10 /* tmpnam function -- UNIX version */ 
tmpnam.c #include <string.h> 
#include "xstdio.h" 


/* UNIX system call */ 
int _Getpid(void); 


char *(tmpnam) (char *s) 
{ /* create a temporary file name */ 
int i; 
char *p; 
unsigned short t; 
static char buf[L_tmpnam]; 
static unsigned short seed = 0; 


if(s == NULL) 
s = buf; 

seed = seed == 0 ? _Getpid() : seed + 1; 

strcpy(s, "/tmp/t" ); 

i = 5; 

p= s + strlen(s) + i; 

Fp = 'NO'; 

for (t = seed; 0 <= --i; t >>= 3) 
*--p = '0' + (t & 07); 

return (s); 


} 


LLL 


函数 Fopen 12-1 显示 了 文件 xfopen.c， 它 定义 了 范 数 _Fopen。 该 函数 把 模式 
指示 符 的 编码 与 打开 文件 的 UNIX 系统 服务 使 用 的 编码 对 应 起 来 。 这 个 程序 
的 正确 版 本 不 应 该 包含 这 些 奇怪 的 数字 ， 而 是 应 该 包含 UNIX 提供 的 定义 相 
关 参 数 的 头 文件 。 


UNIX 不 区 分 二 进 制 和 文本 文件 ， 其 他 的 操作 系统 在 程序 打开 文件 的 
时 候 可 能 会 介意 这 种 差别 。 同 样 ，UNIX 也 不 使 用 附加 的 模式 信息 。( 这 里 
_Fopen 把 模式 参数 当 作 空 串 对 待 ， 因 为 这 个 版 本 并 不 是 特殊 的 版 本 。) 


函数 _Fgpos 图 12-12 显示 了 文件 xfgpos.c， 它 定义 了 函数 _Fgpos。 它 要 求 系统 传 
l 送 文件 定位 符 ， 然 后 代表 流 更 正 所 有 缓冲 的 数据 。UNIX 下 的 文件 定位 符 用 
long 类 型 表示 。 因 此 ，<stdaio.h> 中 定义 的 类 型 fpos_t 是 一 个 只 包含 一 个 
long 成 员 的 结构 。( 我 也 可 以 直接 把 fpos_t 定义 为 long 类 型 ， 但 是 我 想 尽量 
限制 这 种 类 型 .) 在 这 种 情况 下 ， 函 数 fgetpos 和 fsetpos 跟 旧 的 文件 定位 

函数 相 比 没 有 什么 优势 。 然 而 ， 对 其 他 系统 来 说 ， 这 种 区 别 还 是 很 重要 的 。 
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图 12-11 /* _Fopen function -- UNIX version */ 
xfopen.c #include "xstdio.h" 


/* UNIX system call */ 
int _Open(const char *, int, int); 


int _Fopen(const char *path, unsigned int smode, 
const char *mods) 


( /* open from a file */ 
unsigned int acc; 


acc - (smode & ( MOPENR| MOPENW)) == ( MOPENR| MOPENW) ? 2 
smode & MOPENW ? 1 : 0; 

if (smode &  MOPENA) 

acc |= 010; /* O APPEND */ 
if (smode &  MTRUNC) 

acc |= 02000; /* O TRUNC */ 
if (smode & _MCREAT) 

acc |- 01000; /* O CREAT */ 
return ( Open(path, acc, 0666)); 


) a 


图 12-12 /* Fgpos function -- UNIX version */ 
xfgpos.c |#include «errno.h» 
#include "xstdio.h" 


/* UNIX system call */ 
long _Lseek{int , long, int); 


long | Fgpos(FILE *str, fpos t *ptr) 
( /* get file position */ 
long loff = Lseek(str-> Handle, OL, 1); 


if(loff ==-1) 
{ /* query failed */ 
errno = EFPOS; 
return (EOF); 
} 
if(str-> Mode & _MWRITE) 
loff += str->_Next - str-> Buf; 
else if (str-> Mode & MREAD) 
loff -= str-> Nback 
? str-> Rsave - str-> Next + str-> Nback 
str-> Rend - str-> Next; 
if (ptr == NULL) 
return (loff) ; /* ftell */ 
else 
{ /* fgetpos */ 
ptr->_Off = loff; 
return (0); 


} 


286 $ 12% <stdio.h> 


函数 Fspos 


图 12-13 
xfspos.c 


从 另 一 个 方面 来 讲 ，UNIX 下 的 Fapos 更 加 简单 。 在 文本 流 的 内 部 形式 ， 
和 外 部 形式 之 间 不 发 生 转 换 。 因 此 ， 内 部 缓冲 中 对 字符 的 更 正 也 很 简单 。 当 
然 ， 这 是 和 一 个 转换 文本 流 的 系统 相 比 。 比 如 它 用 回 车 加 换行 来 结束 每 个 文本 
行 而 不 只 是 一 个 换行 。 这 就 是 说 ，_Freaa 必须 丢弃 某 些 回 车 而 _Fwrite 必须 
择 人 某 些 回 车 ， 这 也 意味 着 _Fgpos 在 更 正文 件 定 位 符 的 时 候 必 须 纠正 某 些 变 
更 值 。 这 些 问题 可 以 处 理 ， 但 是 它们 使 逻辑 混乱 ， 在 这 里 就 不 进行 说 明了 。 

图 12-13 显示 了 文件 xfspos.c， 它 定义 了 函数 _Fspos。 与 _Fgpos — 


样 ， 它 也 从 简单 的 UNIX VO 模块 中 受益 大多 。 输 出 不 会 造成 任何 问题 ， 因 为 
函数 会 在 修改 文件 定位 符 之 前 清空 所 有 未 写 的 字符 。 


/* _Fspos function -- UNIX version */ 
#include «errno.h» 
include "xstdio.h" 


/* UNIX system call */ 
long . Lseek(int , long, int); 


int _Fspos(FILE *str, const fpos t *ptr, long loff, int way) 
{ /* position a file */ 
if (fflush(str)) 
{ /* write error */ 
errno = EFPOS; 
return (EOF); 
} 


if (ptr) 

loff += ((fpos t *)ptr) -» Off; /* fsetpos */ 
if (way == SEEK CUR && str-> Mode & _MREAD) 

loff -= str-» Nback 


? str-> Rsave - str-> Next + str-> Nback 
: str-> Rend - str-> Next; 


if (way == SEEK CUR && loff != 0 
|| way != SEEK SET || loff != -1) 
loff = Lseek(str-> Handle, Loff, way) ; 
if (loff -- -1) 
{ /* request failed */ 


errno = EFPOS; 
return (EOF); 
} 


else 
{ /* success */ 
if (str->_Mode & (_MREAD|_MWRITE) ) 
{ /* empty buffer */ 
Str->_Next = str->_Buf; 
str->_Rend = str->_Buf; 


str->_Wend str->_Buf; 


str->_Nback = 0; 

} 
str-> Mode &- -( MEOF| MREAD| MWRITE); 
return (0); 


) 
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tmpfile 
clearerr 
feof 
ferror 


图 12-14 
tmpfile.c 


图 12-15 


clearerr.c 


图 12-16 
feof.c 


剩 下 的 3 个 原 语 都 是 宏 。 它 们 都 展开 为 对 直接 执行 UNIX 系统 服务 的 函 


数 的 调用 。"yfuns.h" 的 UNIX 版 本 包含 以 下 语句 ， 


*define Fclose(str)  Close((str)-> Handle) 
#define _Fread(str, buf, cnt) -Read((str)-> Handle, buf, cnt) 
fdefine  Fwrite(str, buf, cnt) -Write((str)-» Handle, buf, cnt) 


int _Close(int); 
int _Read(int, unsigned char *, int); 


int _Write(int, const unsigned char *, int); 


既然 已 经 明白 了 VO 原 语 ， 那 么 对 <stdio.h> 中 声明 的 大 部 分 低级 函 


数 也 就 容易 理解 了 。 现 在 让 我 们 讨论 一 下 剩 下 的 函数 ， 它 们 不 执行 输入 输 


出 ， 


只 是 对 流 进行 设置 或 者 管理 。 图 12-14 显示 了 文件 tmpfile.c, MAR 


tmpfile 是 已 经 遇 到 的 函数 中 的 一 个 简单 应 用 。 图 12-15 (clearerr.c), K 
12-16 (feof.c) 和 图 12-17 (ferror.c) 甚至 更 简单 。 这 些 文件 中 定义 的 函 
数 在 <stdio.h> 中 没有 屏蔽 宏 ， 其 唯一 原因 就 是 它们 的 使 用 太 少 。 


/* tmpfile function */ 
#include <stdlib.h> 
#include <string.h> 
#include "xstdio.h" 


FILE * (tmpfile) (void) 


{ /* open a temporary file */ 

FILE *str; 

char fn[L_tmpnam], *s; 

if ((str = fopen((const char *)tmpnam(fn), "wb+")) == NULL) 

else if ((s = (char *)malloc(sizeof (fn) + 1)) == NULL) 
fclose(str), str = NULL; 

else 


str-» Tmpnam = strcpy(s, fn); 
return (str); 


) 口 


/* clearerr function */ 
#include "xstdio.h" 


void (clearerr) (FILE *str) 


{ /* clear EOF and error indicators for a stream */ 
if (str-> Mode & ( MOPENR| MOPENW)) 
str-» Mode &- -( MEOF| MERR); 


) 口 


/* feof function */ 
#include "xstdio.h" 


int 


(feof) (FILE *str) 
{ /* test end-of-file indicator for a stream */ 
return (str-» Mode & MEOF); 


) 口 


288 £ 12% <stdio.h> 


图 12-17 /* ferror function */ 
ferror.c include "xstdio.h" 


int (ferror) (FILE *str) 
{ /* test error indicator for a stream */ 


return (str->_Mode & _MERR); 
) D 
setbuf 图 12-18 显示 了 文件 setbuf.c， 它 简单 地 由 对 setvbuf 的 一 次 调用 组 
"TT o. 12-19 显示 了 文件 setvpuf.c。 它 的 大 部 分 工作 由 清理 它 的 参数 组 成 。 
注意 ，setvbuf 是 在 流 没有 缓冲 的 时 候 响应 请 求 。 然 而 ， 在 发 生 了 任何 读 或 
者 写 操作 之 后 ， 它 不 一 定 能 成 功 执 行 。 


/* setbuf function */ 
#include "xstdio.h" 


图 12-18 
setbuf.c 


void (setbuf) (FILE *str, char *buf) 


{ /* set up buffer for a stream */ 
setvbuf(str, buf, buf ? _IOFBF : —IONBF, BUFSIZ); 
} 口 


图 12-19 /* setvbuf function */ 
setvbuf.c #include «limits.h» 
#include <stdlib.h> 
finclude "xstdio.h" 


int (setvbuf)(FILE *str, char *abuf, int smode, size t size) 
{ /* set up buffer for a stream */ 
int mode; 
unsigned char *buf = (unsigned char *)abuf; 


if (str-> Mode & ( MREAD| MWRITE)) 
return (-1); 
mode - smode ==  IOFBF ? 0 
smode --  IOLBF ? _MLBF 
smode == _IONBF ? _MNBF : -1; 
if (mode == -1) 
return (-1); 
if (size == 0) 
buf = &str-» Cbuf, size = 1; 
else if (INT MAX « size) 
size - INT MAX; 
if (buf) 


else if ((buf - malloc(size)) -- NULL) 
return (-1); 
else 
mode |-  MALBUF; 
if (str-» Mode & | MALBUF) 
free(str-» Buf), str-» Mode &- ~_MALBUF; 
str->_Mode |= mode; 
Str-» Buf = buf; 
str->_Bend buf + size; 
str->_Next buf; 
str-> Rend buf; 
Str-» Wend buf; 
return (0); 


) 
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文件 定位 函数 TRAA PAIN _Fgpos 和 _Fspos， 文 件 定位 函数 也 是 微不足道 的 。 图 
12-20 到 图 12-24 显示 了 文件 fgetpos.c、fseek.c、fsetpos.c、ftell.c 
和 rewind.c, BRT rewind KØ, FÅNE <stdio.h> 中 提供 了 屏蔽 宏 。 


图 12-20 /* fgetpos function */ 
fgetpos.c #include "xstdio.h" 


int (fgetpos) (FILE *str, fpos t *p) 


{ /* get file position indicator 
return ( Fgpos(str, p)); 
) 


图 12-21 /* fseek function */ 
fseek.c #include "xstdio.h" 


int (fseek) (FILE *str, long off, int smode) 


{ /* set seek offset for stream */ 
return (_Fspos(str, NULL, off, smode)); 
} 口 
图 12-22 /* fsetpos function, */ 
fsetpos.c #include "xstdio.h" 
int (fsetpos) (FILE *str, const fpos t *p) 
( /* set file position indicator for stream */ 
return ( Fspos(str, p, OL, SEEK SET)); 
) 口 
图 12-23 /* ftell function */ 
ftell.c #include "xstdio.h" 
long (ftell) (FILE *str) 
{ /* get seek offset 
return (_Fgpos(str, NULL)); 
} 
图 12-24 


/* rewind function */ 
rewind.c #include "xstdio.h" 


void (rewind) (FILE *str) 


{ /* rewind 
_Fspos(str, NULL, OL, SEEK, SET); 

Str-» Mode &- - MERR; 

) 


Å fgetc 现在 考虑 一 下 读 取 字符 的 函数 。 图 12-25 显示 了 文件 fgetc.c， 它 定义 了 
原型 的 输入 函数 fgetc。 该 函数 首先 寻找 通过 调用 ungetc 函数 回 退 的 字符 。 
如 果 没 有 ，fgetc 就 去 检查 缓冲 区 中 是 否 有 字符 。 它 尝试 通过 调用 _Frprep 
来 重新 填 满 一 个 空 缓冲 区 。 如 果 该 函数 不 能 传递 任何 字符 ， 则 fgetc 返回 
EOF。 有 两 个 函数 是 fgetc 的 简单 变化 形式 。 图 12-26 (getc.c) 和 图 12-27 
(getchar.c) 都 调用 fgetc。 
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图 12-25 
fgetc.c 


图 12-26 
getc.c 


图 12-27 
getchar.c 


函数 ungetc 


fread 
fgets 
gets 


函数 Frprep 


/* fgetc function */ 
#include "xstdio.h" 


int (fgetc) (FILE *str) 


{ /* get a character from stream */ 
if (0 < str->_Nback) 


{ /* deliver pushed back char */ 
if (--str-» Nback == 0) 
str->_Rend = str->_Rsave; 
return (str-> Back[str-> Nback]); 
) 
if (str-> Next < str-> Rend) 


else if ( Frprep(str) <= 0) 
return (EOF); 
return (*str->_Next++); 


} 


/* getc function */ 
#include "xstdio.h" 


int (getc) (FILE *str) 
{ /* get a character from stream */ 
return (fgetc(str)); 


) 口 


/* getchar function */ 
include "xstdio.h" 


int (getchar) (void) 
{ /* get a character from stdin */ 
return (fgetc(stdin)); 


} 口 


还 有 一 个 函数 属于 这 一 组 。 图 12-28 显示 了 文件 ungetc.c。 前 面 已 经 看 
到 了 函数 ungetc 对 其 他 几 个 函数 的 影响 ， 就 是 这 个 函数 。 考 虑 到 它 对 其 他 
函数 造成 的 所 有 影响 ， 函 数 ungetc 本 身 就 非常 简单 了 。 注 意 它 是 怎样 修改 
FLAY FILE 数据 对 象 来 促使 宏 getc 和 getchar 调用 它们 通常 屏蔽 的 函数 的 。 
这 使 得 底层 函数 有 机 会 让 压 人 到 栈 中 的 字符 出 栈 。 


其 他 几 个 函数 的 实现 方法 跟 fgetc 很 像 ， 但 由 于 速度 原因 ， 要 避免 调用 
fgetc。 一 个 是 fread， 在 图 12-29 (fread.c) 中 定义 。 另 外 两 个 在 图 12-30 
(fgets.c) 和 图 12-31 (gets.c) 中 定义 。 仔 细 比 较 这 两 个 图 数 ， 它 们 的 差 
别 很 大 以 致 每 一 个 都 不 值得 在 另 一 个 的 基础 上 编写 。 


最 后 ， 图 12-32 显示 了 文件 xfrprep.c， 它 定义 了 函数 _Frprep， 这 个 
函数 执行 了 读 操 作 的 所 有 严肃 的 工作 。 它 遇 到 读 错误 时 返回 一 个 负 值 ， 在 文 
件 结束 处 返回 零 ， 如 果 流 缓冲 现在 包含 了 字符 就 返回 一 个 正 值 。 这 就 是 分 配 
流 缓冲 和 调用 _Fread 的 地 方 。 所 有 读 取 流 的 函数 最 后 都 要 调用 _Frprep。 


图 12-29 


fread.c 
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/* ungetc function */ 


finclude "xstdio.h" 
int (ungetc)(int c, FILE *str) 
{ 
if (c == EOF 
|] sizeof (str->_Back) 


|| (str-> Mode & ( MOPENR| MWRITE)) ! = 


return (EOF); 
Str-» Mode = 


/* push character back on stream */ 


<= str-> Nback 
—MOPENR) 


Str-» Mode & - MEOF | _MREAD; 


if (str-», Nback == 0) 
H /* disable buffering */ 
str-> Rsave = str-> Rend; 
Str-» Rend = str-> Buf; 
) 
str-> Back[str-» Nback++] = c; 


return ((unsigned char)c); 


) 


/* fread function */ 
#include <string.h> 

#include "xstdio.h" 

size_t (fread) (void *ptr, 
{ 

size t ns = 
unsigned char *s 


size * nelem; 
= ptr; 
if (ns == 0) 

return (0); 

(0 < str-> Nback) 
{ 

for (; 
*s++ = str-> Back[ 
(str-» Nback == 0) 
str-> Rend = 


if 


if 


) 
while 


{ 


(0 < ns) 


if (str-» Next « str-» 


else if ( Frprep(str) 
break; 
{ 


size_t m = str->_Rend 


if (ns < m) 
m - ns; 
memcpy(s, str-» Next, 
m, ns -- m; 
str-» Next += m; 
) 
H 
return 


) 


S += 


((size * nelem - ns 


size t size, 


0 < ns && 0 < str-> Nback; 


size t nelem, FILE *str) 
/* read into array from stream 


/* deliver pushed back chars 
--ns) 
--str-> Nbackl; 


str-> Rsave; 


/* ensure chars in buffer 


_Rend) 


<= 0) 


/* deliver as many as possible 
- str-> Next; 


m); 


) / size) ; 


% <stdio.h> 


图 12-30 
fgets.c 


/* fgets function */ 
include <string.h> 
finclude "xstdio.h" 


char *(fgets)(char *buf, 
{ 


unsigned char *s; 


int n, 


if (n <= 1) 
return (NULL); 
for (s = (unsigned char *)buf; 
{ 
*g = 
if (str-» Nback == 0) 
str-> Rend = 
if (*s++ == '\n') 
{ 
*s = '\0'; 
return (buf); 
} 
} 
while {0 < n) 
{ 


else if (_Frprep(str) 
return (NULL); 


< 0) 


break; 
{ 
unsigned char *sl = 
'An', str->_Rend - 


size_t m = (sl ? sl + 1 
if (n « m) 
sl = NULL, m - n; 
memcpy(s, str-» Next, m); 
S += m, -= m; 
str-> Next += m; 
if (sl) 
{ 
*s = '\0'; 
return (buf); 
} 
} 
} 
if (s == 
return 
else 


(unsigned char *)buf) 
(NULL) ; 


{ 

eS = "NDT: 
return (buf); 
H 


FILE *str) 


/* get a line from stream */ 


0 < --n && str-» Nback; ) 
/* deliver pushed back chars */ 


str-» Back[--str-» Nback]; 


str-> Rsave; 


/* terminate full line */ 


/* ensure buffer has chars */ 


if (str-» Next « str-> Rend) 


else if (str-> Mode & _MEOF) 


/* copy as many as possible */ 


memchr (str->_Next, 
str-> Next) ; 


str-» Rend) - str-> Next; 


/* terminate full line */ 


/* terminate partial line */ 


图 12-31 


gets.c 


#include "xstdio.h" 


char *(gets) (char *buf) 
{ 


unsigned char *s; 


for (s - (unsigned char *)buf; 
{ 
*S = Stdin-» Back[--stdin-» Nback]; 
if (stdin-» Nback -- 0) 
stdin-> Rend - 
if (*s++ == '\n') 
t 
s[-1] = '\0'; 


return (buf); 
} 
} 
for (; ; ) 


{ 


if (stdin-» Next < stdin->_ 


else if ( Frprep(stdin) 
return (NULL); 
else if 
break; 
t 


stdin-» Rsave; 


« 0) 


(stdin-» Mode & _MEOF) 


12.4 <stdio.h> 的 实现 293 


/* gets function */ 
#include <string.h> 


/* get a line from stdio */ 


stdin->_Nback; ) 
/* deliver pushed back chars */ 


/* terminate full line */ 


/* ensure chars in buffer */ 
Rend) 


/* deliver as many as possible */ 


unsigned char *s1 = memchr(stdin-> Next, 
‘\n', stdin->_Rend - stdin-» Next); 


(sl ? sl + 1 
- stdin-> Next; 


size t m= 


memcpy(s, stdin-> Next, 
S += m; stdin-» Next += m; 
if (s1) 

( 

s[-1] - 

return 


) 


m); 


NO; 
(buf); 


} 

} 
if (s == (unsigned char *)buf) 

return (NULL); 
else 

{ 

*s = '\O'; 
return (buf); 


) 


stdin-> Rend) 


/* terminate full line */ 


/* terminate partial line */ 


aj 
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图 12-32 /*  Frprep function */ 
xfrprep.c |tinclude <stdlib.h> 
#include "xstdio.h" 
#include "yfuns.h" 


int _Frprep(FILE *str) 


{ /* prepare stream for reading 
if (str-> Next < str-> Rend) 
return (1); 
else if (str-> Mode & MEOF) 
return (0); 
else if ((str-> Mode & ( MOPENR| MWRITE)) !-  MOPENR) 
{ /*can't read after write 
str-> Mode |= _MERR; 
return (-1); 
) 
if (str-> Buf) 
else if ((str-» Buf = malloc(BUFSIZ)) == NULL) 
{ /* use 1-char _Cbuf 
str-> Buf = &str-> Cbuf; 
str-> Bend = str-> Buf + 1; 
) 
else 
( /* set up allocated buffer 
Str-» Mode |-  MALBUF; 
str-» Bend str-» Buf + BUFSIZ; 
) 
str-> Next - str-» Buf; 
str-> Rend = str-> Buf; 
str-> Wend = str-> Buf; 
( /* try to read into buffer 
int n = Fread(str, str-» But, str-» Bend - str-> Buf); 


if (n<0) 
{ /* report error and fail 
str->_Mode | = _MERR; 
return (-1); 
} 
else if (n == 0) 
{ /* report end of file 
str->_Mode = (str->_Mode & ~_MREAD) | _MEOF; 
return (0); 
} 
else 
{ /* set up data read 
str->_Mode |= _MREAD; 
str-> Rend += n; 
return (1); 


函数 fputc 


图 12-33 
fputc.c 


图 12-34 


putc.c 


图 12-35 
putchar.c 


函数 Fwprep 
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下 面 考虑 一 下 写字 符 的 函数 。 图 12-33 显示 了 文件 fputc.c， 它 定义 了 
原型 的 输出 函数 fputc。 该 函数 首先 检查 流 缓 冲 是 否 有 空间 供 写 人 字符 。 如 
果 没 有 可 用 的 空间 ， 闻 数 fputc 就 尝试 通过 调用 _Fwprep 来 设置 一 个 输出 组 
冲 区 。 如 果 这 个 函数 不 能 提供 空间 ， 函 数 fputc 返回 值 EoF。 一 旦 它 向 缓冲 


区 中 添加 了 一 个 字符 ，fputc 在 返回 之 前 测试 是 否 用 完了 缓冲 区 。 有 两 个 函 
数 是 fputc 的 简单 变化 形式 。 图 12-34 (putc.c) 和 图 12-35 (putchar.c) 
都 调用 fputc。 


/* fputc function */ 
#include "xstdio.h" 


int (fputc) (int ci, FILE *str) 


{ /* put a character to stream */ 
unsigned char c = ci; 


if (str->_Next < str-> Wend) 


else if ( Fwprep(str) < 0) 
return (EOF); 

*str-> Next++ - c; 

if (str-» Mode & ( MLBF| MNBF)) 


{ /* disable macros and drain */ 
str-> Wend = str-> Buf; 
if ((str-» Mode & MNBF || c == '\n') && fflush(str)) 
return (EOF); 
H 
return (c); 
} o 


/* putc function */ 
#include "xstdio.h" 


int (pute) (int c, FILE *str) 


{ /* put character to stream */ 
return (fputc(c, str)); 
) 口 


/* putchar function */ 
#include "xstdio.h" 


int (putchar) (int c) 


{ /* put character to stdout */ 
return (fputc(c, stdout)); 
} 口 


图 12-36 显示 了 文件 xfwprep.c， 它 定义 了 函数 Fwprep, NR AUST 
成 写 的 所 有 准备 工作 。 发 生 写 错误 时 ， 函 数 返 回 一 个 负 值 ， 如 果 流 缓冲 现在 
包含 可 以 写 人 字符 的 空间 ， 就 返回 零 。 这 就 是 流 缓冲 分 配 的 地 方 ， 所 有 向 流 
写 入 内 容 的 函数 最 后 都 要 调用 Fwprep. 
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Æ 12-36 
xfwprep.c 
函数 fflush 
PES perror 
fwrite 
fputs 

puts 


/* Fwprep function */ 
#include <stdlib.h> 
#include "xstdio.h" 
#include "yfuns.h" 


int _Fwprep(FILE *str) 
{ /* prepare stream for writing */ 
if (str-» Next < str-> Wend) 
return (0); 
else if (str-> Mode & MWRITE) 
return (fflush(str)); 


else if ((str-> Mode & (. MOPENW | MREAD) ) I = _MOPENW) 
{ /* can't write after read */ 
str->_Mode |= _MERR; 
return (-1); 


} 
if (str->_Buf) 


else if ((str->_Buf = malloc(BUFSIZ)) == NULL) 
{ /* use 1-char Cbuf */ 
str-» Buf = &str-» Cbuf; 
str-> Bend = str-» Buf + 1; 
H 
else 
{ /* use allocated buffer */ 
str->_Mode |= _MALBUF; 
str->_Bend = str->_Buf + BUFSIZ; 
} 
str->_Next 
str->_Rend str->_Buf; 
str->_Wend str-> Bend; 
str-» Mode |- | MWRITE; 
return (0); 


) 


str-> Buf; 


图 12-37 显示 了 文件 ftlush.c， 这 就 是 调用 函数 _Pwrite 把 流 缓冲 的 
内 容 写 出 的 地 方 。 如 果 参 数 是 一 个 空 指针 ， 函 数 就 对 Piles 数组 的 每 一 个 
非 空 元 素 调用 它 本 身 。 这 里 用 递归 代替 循环 来 使 控制 流 更 加 清晰 。 对 这 样 的 
调用 来 说 ， 性 能 不 是 主要 的 考虑 因素 。 


还 有 一 个 函数 也 属于 这 个 组 。 图 12-38 显示 了 文件 perror.c， 它 生成 一 
条 错误 信息 并 把 它 写 人 标准 错误 流 中 。 画 数 Strerror ZRAZ strerror 
(这 两 个 函数 都 在 <string.h> 中 声明 ) 的 工作 ， 但 是 使 用 的 缓冲 区 是 调用 者 
提供 的 。 不 允许 函数 perror 修改 strerror 中 的 静态 存储 空间 中 的 内 容 。 因 
此 ， 每 一 个 函数 都 应 该 用 它 自 己 的 静态 缓冲 区 调用 _Strerror。 


其 他 几 个 函数 的 实现 方法 跟 fputc 很 像 ， 但 由 于 速度 原因 ， 要 避免 调用 
fputc。fputc 的 一 个 变化 形式 是 fwrite， 在 图 12-39 (fwrite.c) PEX. 
另外 两 个 在 图 12-40 (fputs.c) 和 图 12-41 (puts.c) 中 定义 。 后 者 是 前 者 
的 一 个 简单 变化 形式 。 
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图 12-37 
fflush.c 


/* fflush function */ 
#include "xstdio.h" 
#include "yfuns.h" 


int (fflush) (FILE *str) 

( /* flush an output stream 
*/ 

int n; 

unsigned char *s; 


if (str -- NULL) 
{ /* recurse on all streams */ 
int nf, stat; 


for (stat = 0, nf = 0; nf < FOPEN_MAX; ++nf) 
if (_Files[nf] && fflush( Files[nf]) < 0) 
stat - EOF; 
return (stat); 
) 
if (! (str-», Mode & _MWRITE) ) 
return (0); 
for (s = str-» Buf; S < str-> Next; s += n) 


( /* try to write buffer */ 
n = Fwrite(str, s, str-> Next - s); 
if (n <= 0) 
{ /* report error and fail */ 
str-> Next = str-> Buf: 
Str-» Wend = str-> Buf; 
str-» Mode |-  MERR; 
return (EOF); 
} 


} 
str-» Next = str-» Buf; 
str-> Wend = str-> Bend; 
return (0); 


图 12-38 /* perror function */ 
perror.c finclude <errno.h> 
#include <string.h> 
#include "xstdio.h" 


void (perror) (const char *s) 
{ /* put error string to stderr */ 


static char buf[) = ("error #xxx"}; 


if (s) 
{ /* put user-supplied prefix */ 
fputs(s, stderr); 
fputs(": ", stderr); 
} 
fputs(_Strerror(errno, buf), stderr); 
fpute('\n', stderr); 
} 
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图 12-39 /* fwrite function */ 
fwrite.c |#include <string.h> 


#include "xstdio.h" 


size_t (fwrite) (const void *ptr, size_t size, 
size t nelem, FILE *str) 
{ /* write to stream from array */ 
char *s = (char *)ptr; 
size_t ns = size * nelem; 


if (ns == 0) 
return (0); 

while (0 < ns) 
{ /* ensure room in buffer */ 
if (str-> Next < str-> Wend) 


else if ( Fwprep(str) < 0) 


break; 
{ /* copy in as many as possible */ 
char *sl = str-» Mode & _MLBF 
? memchr (s, 'Mn', ns) : NULL; 
size_t m = sl ? sl - s +1: ns; 
size_t n = str->_Wend - str-> Next: 


if (n < m) 

sl = NULL, m =n; 
memcpy(str-» Next, s, m); 
S += m, ns -= m; 


str-» Next += m; 
if (sl && fflush(str)) 


{ /* disable macros on failure */ 
str->_Wend = str->_Buf; 
break; 
} 
} 
} 
if (str-> Mode & _MNBF) 

{ /* disable and drain */ 

str-> Wend = str-> Buf; 

fflush(str); 


} 


return ((size * nelem - ns) / size); 


} 口 
LL ~ 
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几 12-40 /* fputs function */ 
fputs.c include <string.h> 
#include "xstdio.h" 


int (fputs)(const char *s, FILE *str) 
{ /* put a string to stream */ 
while (*s) 
{ /* ensure room in buffer */ 


if (str-> Next < str-> Wend) 
else if ( Fwprep(str) < 0) 
return (EOF); 


{ /* copy in as many as possible */ 
const char *sl = str-» Mode & MLBF 
? strchr(s, 'Mn') : NULL; 
size_t m= sl ? sl - s + I : strlen(s); 
size tn; 
n = str-» Wend - str-» Next; 
if (n < m) 


sl = NULL, m = n; 
memcpy(str-» Next, S, m); 
S += m; 
str-> Next += m; 
if (sl && fflush(str)) 
H /* fail on error */ 
Str-» Wend = str-> Buf; 
return (EOF); 
} 


} 
} 
if (str-» Mode & _MNBF) 

{ /* disable macros and drain */ 
str->_Wend = str->_Buf; 
if (fflush(str)) 

return (EOF) ; 
} 


return (0); 


图 12-41 /* puts function */ 
puts.c #include "xstdio.h" 


int (puts) (const char *s) 
{ /* put string + newline to stdout */ 
return (fputs(s, stdout) < 0 
|| fputc('\n', stdout) < 0 ? EOF : 0); 
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这 就 是 低级 输入 输出 函数 的 完整 集合 。 就 像 你 所 看 到 的 ， 没 有 一 个 特别 
难 。 然 而 ， 整 个 集合 却 累积 了 很 多 代码 ， 而 且 这 仅仅 是 开始 。 实 现 <stdio. 
h» 比较 用 难 的 部 分 是 执行 格式 化 输入 输出 。 


格式 化 输出 有 6 个 责 数 执行 格式 化 输出 《打印 函 数 )。 所 有 的 函数 都 调用 一 个 公共 
PR _Printf， 这 个 两 数 声明 如 下 : 


int Printf(void *(*pfn)(void *, const char *, size t), 
void *arg, const char *fmt, va list ap); 


用 到 的 参数 如 下 : 
O pfn 一 一 指向 一 个 函数 的 指针 ， 该 函数 用 来 传送 字符 。 
口 _arg 一 一 通用 的 数据 对 象 指 针 ， 作 为 传送 一 数 的 一 个 参数 被 传递 。 
O fmt 指向 格式 串 的 指针 。 


D ap 一 一 指向 上 下 文 信息 的 指针 ， 该 信息 描述 了 一 个 可 变 参数 表 。 
如 果 成 功 ， 传 送 函 数 返回 arg 的 一 个 新 值 ， 否 则 ， 它 返回 一 个 空 指针 来 标志 


一 个 写 错误 。 


fprintf 图 12-42 显示 了 文件 fprintf.c， 它 定义 了 函数 fpirntf 和 它 使 用 的 传 

printf eg prout。 在 这 种 情况 下 ， 通 用 指针 把 FILE 指针 从 fprintf 两 数 通 过 
_Printf 传送 给 prout。 调 用 fprintf Hj, prout 就 使 用 这 个 指针 对 指定 的 
流 进行 写 操作 。 图 12-43 显示 了 文件 printf.c， 它 是 fprintf 的 一 个 简单 的 
变化 形式 。 


图 12-42 /* fprintf function */ 
fprintf.c #include "xstdio.h" 


static void *prout(void *str, const char *buf, size t n) 
( /* write to file */ 
return (fwrite(buf, 1, n, str) -- n ? str : NULL); 


) 


int (fprintf)(FILE *str, const char *fmt, ...) 
{ /* print formatted to stream */ 
int ans; 
va_list ap; 


va_start(ap, fmt); 
ans = _Printf(&prout, str, fmt, ap); 
va_end(ap); 


return (ans); 


} 口 
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图 12-43 
printf.c 


其 他 打印 函数 


图 12-44 
sprintf.c 


图 12-45 


vfprintf.c 


| printf function */ 
#include "xstdio.h" 


static void *prout(void *str, const char *buf, size t n) 
{ /* write to file */ 
return (fwrite(buf, 1, n, str) == n ? str : NULL); 


} 


int (printf) (const char *fmt, ...) 


{ /* print formatted to stdout */ 
int ans; 


va_list ap; 


va_start(ap, fmt); 
ans = _Printf (&prout, stdout, fmt, ap); 
va_end(ap); 


return(ans); 
[> 3 


图 12-44 显示 了 文件 sprintf.c。 这 里 ， 当 调用 sprintf 时 ， 通 用 指针 
指明 了 在 指定 的 缓冲 中 存储 字符 的 下 一 个 位 置 。 注 意 ， 如 果 _Printf 执行 成 
Jj, MÅ sprintf 也 写 和 一 个 终止 的 空 字符 。 图 12-45 到 图 1247 显示 了 文件 
vfprintf.c, vprintf.c 和 vsprintft.c。 它 们 都 是 那 3 个 更 常用 的 打印 图 数 
的 变化 形式 。 

/* sprintf function */ | 


#include <string.h> 
#include "xstdio.h" 


static void *prout(void *s, const char *buf, size t n) 


{ /* write to string */ 
return ((char zi memcpy(s, buf, n) + n); 
} 

int (sprintf) (char ze, const char *fmt, ...) 
{ /* print formatted to string */ 
int ans; 


va_list ap; 


va_start(ap, fmt); 
ans = Printf(&prout, s, fmt, ap); 
if (0 <= ans) 
s[ans] = '\0'; 
va, end(ap); 
return (ans); 


} 口 


[7* vfprintf function */ 
#include "xstdio.h" 


Static void *prout(void *str, const char *buf, size t n) 
{ /* write to file */ 
return (fwrite(buf, 1, n, str) ==n ? str : NULL); 


} 


int (vfprintf) (FILE *str, const char *fmt, char *ap) 
{ /* print formatted to stream from arg list */ 
return ( Printf(&prout, str, fmt, ap)); 


) 口 
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图 12-46 
vprintf.c 


图 12-47 
vsprintf.c 


函数 Printf 


/* vprintf function */ 
finclude "xstdio.h" 


static void *prout(void *str, const char *buf, size t n) 
{ /* write to file */ 
return (fwrite(buf, 1, n, str) == n ? str : NULL); 
} 


int (vprintf) (const char *fmt, char *ap) 


{ /* print formatted to stdout from arg list */ 
return (_Printf(&prout, stdout, fmt, ap)); 
} L1 


/* vsprintf function */ 
finclude <string.h> 
#include "xstdio.h" 


static void *prout(void *s, const char *buf, size t n) 
{ /* write to string */ 
return ((char *)memcpy(s, buf, n) + n); 


} 


int (vsprintf) (char *s, const char *fmt, char *ap) 
{ /* print formatted to string from arg list 
int ans =  Printf(&prout, s, fmt, ap); 


if (0 <= ans) 
s[ansl = 'NO'; 
return (ans); 


) 


图 12-48 显示 了 文件 xprintf.c， 它 定义 了 函数 _Printf， 该 函数 完成 
所 有 的 工作 。<stalib.h> 中 声明 的 内 部 函数 _MBtowc， 使 用 用 户 在 每 次 调用 
时 提供 的 _Mbstate 类 型 的 状态 记忆 ， 把 格式 分 解 为 一 个 多 字 节 串 进行 分 析 。 
(参考 第 13 章 。) 通过 调用 底层 函数 而 不 是 mbtowc, | Printf 就 可 以 避免 改 
AE mbtowc 的 内 部 状态 。C 标准 禁止 任何 这 样 的 改变 。 

测试 转 义 字符 百 分 号 (%)〉 是 一 件 很 麻烦 的 事 。 唯 一 安全 的 方式 是 把 格式 串 
转换 为 一 个 宽 字 节 字 符 序列 ， 然 后 寻找 一 个 和 百 分 号 对 应 的 字符 。 必 须 把 wc 
数据 对 象 和 百 分 号 的 宽 字 节 字 符 编码 进行 对 比 。 不 幸 的 是 ， 那 些 值 存在 着 某 些 
不 确定 性 。C 标准 要 求 基本 C 字符 集中 的 每 一 个 字符 都 要 有 一 个 宽 字 节 字 符 编 
码 与 它 的 单字 符 编码 等 价 。 百 分 号 的 单字 符 编码 为 '%'， 那 么 等 价 的 宽 字 节 字 
符 编码 就 是 L'%'。 但 是 ， 仍 然 存在 一 个 问题 ， 就 是 C 标准 是 否 应 该 要 求 这 样 
的 等 价 形式 。 这 样 可 能 会 导致 用 户 依靠 规则 的 某 个 脆弱 点 轻率 地 编写 代码 。 

还 存在 另外 一 个 不 确定 性 。 一 个 实现 可 以 支持 宽 字 节 字 符 的 多 种 编码 ， 
至 少 原则 上 可 以 。 当 宽 字 节 字 符 常量 和 当前 的 字符 集 不 匹配 的 时 候 ， 可 以 想 
到 一 个 程序 会 改变 一 个 区 域 设置 。 这 可 能 不 是 很 明智 ， 但 C 标准 并 没有 明确 
地 禁止 这 一 点 。 因 此 ， 一 个 谨慎 的 程序 应 该 避免 使 用 '%' 或 者 L'%' 作为 百 
分 号 的 宽 字 节 字符 编码 。 


图 12-48 
xprintf.c 
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/* Printf function */ 
#include «ctype.h» 
#include <stdlib.h> 
#include <string.h> 
finclude "xstdio.h" 


#define MAX PAD (sizeof (spaces) - 1) 
#define PAD(s, n) if (0 < (n)) (int i, j = (n); \ 
for (; 0« j; j -= i) \ 


fi = MAX PAD < j ? MAX PAD : j; PUT(s, i);) ) 
#define PUT(s, n) \ 
if (0 < (n)) (if ((arg = (*pfn) (arg, s, n)) != NULL) \ 
x.nchar += (n); else return (EOF); ) 


Static char spaces [] - " "s 


i 


static char zeroes[] = "00000000000000000000000000000000"; 


int ,Printf(void *(*pfn)(void *, const char *, size t), 
void *arg, const char *fmt, va list ap) 
{ /* print formatted */ 
_Pft x; 


for (x.nchar = 0; ; ) 


{ /* scan format string */ 
const char *s = fmt; 

{ /* copy any literal text */ 
int n; 


wchar t wc; 
.Mbsave state - (0); 


while (0 < {n = Mbtowc(&wc, s, MB CUR MAX, &state))) 
{ /* scan for '$' or '\O' */ 
S += n; 
if (wc == '$&') 
{ /* got a conversion specifier */ 
--g; 
break; 
) 
) 


PUT(fmt, s - fmt); 
if (n <= 0) 
return (x.nchar); 


fmt = ++s; 
} 
{ /* parse a conversion specifier */ 
const char *t; 
static const char fchar[] = í" +-#0"}; 
static const unsigned int fbit[] - ( 


FSP,  FPL,  FMI, _FNO,  FZE, 0}; 
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) 


for (x.flags = 0; (t = strchr(fchar, *s)) := NULL; ++S)》 
x.flags | = fbit[t - fcharl; 
if (*s == '*') 
{ /* get width argument */ 


x.width = va_arg(ap, int); 
if (x.width < 0) 


{ /* same as '-' flag */ 
x.width = -x.width; 
x.flags |= FMI; 
) 
十 十 S 
H 
else /* accumulate width digits */ 


for (x.width = 0; isdigit(*s); --8) 
if (x.width < WMAX) 


x.width = x.width * 10 + *s ~ '0'; 
if (*s t= 2") 
x.prec - -1; 
else if (*++s == *') 
{ /* get precision argument x] 


x.prec = va_arg(ap, int); 
KH 
} 
else /* accumulate precision digits */ 
for (x.prec = 0; isdigit(*s); ++s) 
if (x.prec < WMAX) 
x.prec = x.prec * 10 + *s - 'O':; 
x.qual = strchr("hlL", *s) ? este 1 "NOG 
) 
{ /* do the conversion */ 
char ac[32]; 


 Putfld(&x, &ap, *s. ac); 

x.width -= x.n0 + x.nz0 + x.nl + x.nzl + x.n2 + X.nZ2; 

if (I(x.flags & FMI)) 
PAD(spaces, x.width); 

PUT (ac, x.n0); 

PAD (zeroes, x.nz0); 

PUT(x.s, x.n1); 

PAD(zeroes, x.nzl); 

PUT(x.s + X.nl, x.n2); 

PAD(zeroes, x.nz2); 

if (x.flags & , FMI) 
PAD(spaces, x.width); 

) 
fmt = s + 1; 


| 
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PUT 
PAD 

E WMAX 
类 型 Ge 


实现 者 对 于 和 we 作 比 较 的 值 有 3 种 选择 : 

O 为 了 保持 和 旧 的 C 翻译 器 保持 最 大 的 兼容 ， 使 用 '$'。 依 赖 于 等 价 
的 且 不 随 区 域 设 置 改变 的 编码 。 

D 为 了 最 大 的 清晰 性 ， 使 用 工 '#s' 。 依 赖 于 不 随 区 域 设置 改变 的 编码 。 

O 在 声明 了 wchar_t wcs[2] 之 后 ， 在 _Printf ÆR AN 执行 
mbstowcs (wcs, "%$",1)。 这 样 就 把 百 分 号 当前 的 宽 宇 节 字 符 编 码 存 
储 在 了 wcs[0] hr, (mbstowcs 在 <stdlib.h> 中 声明 。) 

鉴于 C 翻译 器 、C 标准 和 多 字 节 字符 所 支持 的 当前 状态 ， 我 选择 了 第 一 
种 最 明智 的 方案 。 然 而 ， 这 个 领域 是 飞速 发 展 的 。 在 不 久 的 将 来 ， 另 外 一 种 
选择 可 能 会 更 加 谨慎。 

_Printf 的 剩余 代码 或 者 它 的 附属 函数 就 不 用 担心 多 字 节 字符 的 问题 了 。 
转换 说 明 符 由 基本 C 字符 集中 的 字符 组 成 。 每 一 个 说 明 符 都 有 一 个 单字 符 编 
码 。( 原 则 上 ， 一 个 格式 串 可 能 在 转换 说 明 符 中 包含 多 余 的 转移 编码 ， 但 我 
选择 了 不 支持 这 种 行为 。) 

因此 _Printf 只 担心 转换 说 明 符 之 间 的 字面 量 文本 中 的 多 字 节 字符 。 一 旦 
它 发 现 了 很 大 一 部 分 字面 量 文本 ， 它 就 传送 这 样 的 字符 直到 遇 到 百 分 号 ， 但 不 
包括 百 分 号 。 宏 PUT 定义 在 这 个 C 源 文件 顶部 ， 用 来 传送 字符 。 一 定 要 注意 对 
它 的 使 用 。 不 能 把 这 个 操作 打包 成 一 个 函数 。 如 果 传 送 珊 数 报告 一 个 错误 ， 它 
就 需要 从 Printf 中 返回 。 另 一 方面 ， 重 复 地 使 用 这 样 繁琐 的 功能 也 没有 什么 
好 处 。 由 于 很 多 相同 的 原因 ， 我 也 创建 了 宏 PAD 用 来 传送 填充 的 零 或 者 空格 。 

— H Printf 在 格式 中 遇 到 了 百 分 号 ， 它 就 分 析 后 面 的 转换 说 明 符 。 
它 将 标志 转换 为 函数 _Printf 和 它 的 子 函数 中 使 用 的 指示 符 集 。 头 文件 
"xstdio.h" 包含 了 下 面 的 宏 定义 : 


fdefine FSP Ox01 
fidefine  FPL 0x02 
#define  FMI 0x04 
#define  FNO 0x08 
#define  FZE 0x10 


这 些 定义 分 别 和 空格 、+、-、# 和 0 这 几 个 标志 一 一 对 应 。 

头 文件 "xstaio.h" 把 宏 _WMAX 定义 为 999。_Printf 使 用 这 个 值 来 限制 
字段 宽度 和 精度 值 的 大 小 。 它 必须 足够 大 以 描述 支持 的 最 大 的 转换 (至少 生 
成 509 个 字符 ); 也 要 足够 小 以 阻止 short 整数 的 溢出 不 能 超过 32767). R 
使 用 999 来 简化 对 累加 器 循环 的 测试 。 

Printf 把 关于 转换 说 明 符 的 信息 放 到 一 个 _Pft 类 型 的 结构 x 中 。 附 属 
函数 填充 附加 的 信息 。 当 它们 完成 它们 的 工作 时 ，_Printf 只 要 测试 x 的 内 
容 就 可 以 知道 要 传送 什么 字符 。 头 文件 "xstdio.h" 包含 了 以 下 类 型 定义 : 

typedef struct ( 

union ( 


long li; 
long double ld; 
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函数 Putfld 


} vi 
char *s; 
int n0, nz0, nl, nzl, n2, nz2, prec, width; 
size t nchar; 
unsigned int flags; 
char qual; 
) Pft; 


它 的 成 员 有 : 

O v 一 一 在 接收 参数 (CPutfld) 的 函数 和 把 参数 转换 为 文本 (_Litob 
或 者 _Latcb) 的 函数 之 间 传 递 一 个 整数 值 (v.1i) 或 者 一 个 浮 点 值 
(v.1d), 

传递 v 的 转换 使 用 的 文本 缓冲 的 地 址 。 

n0 一 一 对 文本 缓冲 ac 开始 处 _Printf 首先 要 传送 的 字符 的 数目 进行 计数 。 
nz0 一 一 对 下 一 次 要 传送 的 零 的 数目 进行 计数 。 

nl 一 一 对 ac 中 下 一 次 要 传送 的 后 续 字 符 的 数目 进行 计数 。 

nz1 一 一 对 下 一 次 要 传送 的 零 的 数目 进行 计数 。 

n2 一 一 对 ac 中 下 一 次 要 传送 的 后 续 字 符 的 数目 进行 计数 。 

nz2 一 一 对 下 一 次 要 传送 的 零 的 数目 进行 计数 。 

prec 一 一 保存 转换 说 明 符 中 的 精度 (如 果 没 有 的 话 ， 值 为 -1)。 
width 一 一 保存 转换 说 明 符 中 的 字段 宽度 (如 果 没 有 的 话 ， 值 为 0)。 
nchar 一 一 对 目前 为 止 已 经 传送 的 字符 进行 计数 。 

flags 一 一 保存 转换 说 明 符 中 编码 的 标志 。 

qual 一 一 保存 转换 说 明 符 中 的 大 小 限定 符 Ch. 1. D). 

所 有 的 计数 器 都 是 有 必要 的 ， 这 样 可 以 把 对 文本 缓冲 ac 的 大 小 的 需要 
减 到 最 小 。 缓 冲 应 该 足够 大 以 表示 数字 转换 中 所 有 有 意义 的 精度 ， 这 样 才 有 
意义 。 然 而 ， 不 需要 在 缓冲 中 写 人 很 长 的 零 序 列 。 最 好 用 一 个 像 PAD 这 样 的 
宏 来 对 它们 进行 计数 和 生成 它们 的 值 。 

两 个 例子 可 以 说 明 这 个 问题 。 第 一 个 是 表达 式 printf("$015.5f " 
-1e4)， 它 生成 文本 -00010000.00000。 注 意 3 个 0、4 个 0 和 5 个 0 的 序列 混 
杂 在 其 他 文本 之 间 。 这 对 它们 在 缓冲 中 的 聚集 没什么 坏处 。 但 是 ， 如 果 把 表达 式 
改 为 printf("%$0500.200f",- 1e37) 会 发 生 什 么 呢 ? 它 是 一 个 任意 实现 必须 
支持 的 可 移植 的 表达 式 。 它 也 生成 了 数 百 个 零 ， 其 中 最 少 的 序列 有 37 个 零 ， 它 
就 需要 更 大 的 缓冲 了 。 

为 了 得 到 更 大 的 灵活 性 ， 我 添加 了 一 些 复杂 的 东西 ， 而 不 是 对 字段 宽度 
或 者 精度 进行 额外 的 限制 。 那 些 转 换 值 的 清 数 的 逻辑 很 难 阅读 ， 但 换 来 的 是 
代码 可 以 处 理 很 多 苛刻 的 需求 。 

图 12-49 显示 了 文件 xputfld.c， 它 定义 了 图 数 Putfld, PRU Printf 
调用 它 来 处 理 一 个 转换 说 明 。_Putfla 函数 由 一 个 很 大 的 switch 语句 组 成 ， 
它 分 组 处 理 转换 说 明 符 。_Putflda 从 可 变 参 数 表 中 搜集 需要 的 参数 ， 然 后 直 
接 处 理 数字 转换 的 符号 和 所 有 只 涉及 文本 的 转换 ， 而 把 实际 的 数字 转换 交 给 
两 个 附属 函数 中 的 一 个 来 处 理 。 


S 
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图 12-49 /* Putfld function */ 
xputfld.c #include <string.h> 
#include "xstdio.h" 
/* macros */ 
*if _DLONG 
#define LDSIGN(x) \ 
i t (unsigned short *)&(x)) [DO ? 4 : 0) & 0x8000) 
#else 
#define LDSIGN(x) (((unsigned short *)&(x)) [ DO] & 0x8000) 
#endif 
void _Putfld(_pft *px, va list *pap, char code, char *ac) 
{ /* convert a field for Printf */ 
px-»n0 = px->nz0 = px-»nl = px->nzl = px->n2 = px->nz2 = 0; 
switch (code) 
{ /* switch on conversion specifier */ 
case 'c': /* convert a single character */ 
ac[px->nO0++]=va arg(*pap,int); 
break; 
case 'd': case 'i': /* convert a signed decimal integer */ 
px-»v.li = px-»qual == '1' ? 
va arg(*pap, long) : va arg(*pap, int); 
if (px->qual == 'h') 
px-»v.li = (short)px-»v.li; 
if (px-»v.li « 0) /* negate safely in _Litob */ 
ac[px->nO++] = '-'; 
else if (px->flags & FPL) 
ac[px->n0++] = '*'; 
else if (px->flags & _FSP) 
ac({px->n0+4+] = ' '; 
px->s = &ac[px-»n0]; 
_Litob(px, code); 
break; 
case 'o': case 'u': 
case 'x': case 'X': /* convert unsigned */ 
px-»v.li = px->quai == 'i' ? 
va_arg(*pap, long) : va_arg(*pap, int); 
if (px->qual == ‘h') 
px-»v.li = (unsigned short) px->v.1li; 
else if (px->qual == '\0') 
px-»v.li = (unsigned int) px->v.1li; 
if (px->flags & FNO && px-»v.li !- 0) 
{ /* indicate base with prefix */ 
ac[px-»nO44] = '0'; 
if (code == 'x' || code == 'X') 
ac [px->n0++] = code; 
) 
px-»s = &ac[px-»n0]; 
_Litob(px, code); 
break; 
case 'e': case 'E': case 'f': /* convert floating */ 


case 'g': case 'G': 
px-»v.ld = px->qual == 'L' ? 
va_arg(*pap, long double) 


va_arg(*pap, double); 
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图 12-49 | if (LDSIGN(px-»v.ld)) 
(4) ac[px->n0++] = ' ' 
else if (px->flags & _FPL) 
ac[px->n0++] = ‘+! 
else if (px->flags & FSP) 
ac[px->n0++] = ' '; 
px->s = &ac[px-»n0]; 
_Ldtob(px, code); 
break; 
case ' n' : /* return output count */ 
if (px->qual == 'h') 
*va arg(*pap, short *) - px-»nchar; 
else if (px-»qual !- '1') 
*va_arg(*pap, int *) = px-»nchar; 
else 
*va arg(*pap, long *) - px-»nchar; 
break; 
case 'p' : /* convert a pointer, hex long version */ 
px-»v. ai = (long)va arg(*pap, void *); 
px-»s - = &acipx- »n0]; 
_Litob(px, 'x'); 
break; 
case 's': /* convert a string */ 
px-»s = va arg(*pap, char zi: 
px->nl - strlen(px->s); 
if (0 <= px->prec k& px->prec < px-»nl) 
px->nl = px->prec; 
break; 
case '$': /* puta '$' */ 
ac[px->nO0++] = '$'; 
break; 
default: /* undefined specifier, print it out */ 
ac[px->n0++] = code; 
} 

_Putf1d 通 过 调用 Litob 执行 所 有 的 整数 转换 。 图 12-50 显示 了 文件 
xlitob.c, 它 定义 了 函数 _Litob。 它 转换 的 值 px->v.1i 类 型 为 long。 这 
有 一 点 冒险 。 如 果 把 一 个 大 于 LONG MAX 的 unsigned long 类 型 的 值 存储 在 
long 类 型 的 变量 中 ， 一 个 计算 机 体系 结构 就 可 以 报告 算术 溢出 。 因 此 表达 式 
printf ("%x", 0x80000000L) 可 能 会 正确 地 打印 ， 但 也 可 能 不 会 。C 标准 
规定 所 有 整数 转换 的 参数 都 应 该 是 有 符号 类 型 。 因 此 ， 这 种 冒险 是 由 于 打印 
函数 遗传 的 弱点 引起 的 ， 而 不 是 因为 任何 实现 的 某 些 决策 。 

从 好 的 一 方面 说 ，_Putf1lq 和 Litob 都 很 严密 。 它 们 避免 了 求 long 类 
型 的 相反 数 ， 因 为 那 种 操作 在 2 的 补 码 机 器 下 会 造成 溢出 。 相 反 ，_Putfla 
ib _Litob 把 值 转换 为 unsigned long 类 型 ， 然 后 再 求 它 的 相反 数 ， 这 样 就 不 
会 造成 溢出 了 。 只 要 一 个 任意 的 unsigned long 类 型 可 以 安全 地 转换 为 long 类 
型 然后 再 转换 回来 ， 这 个 实现 就 可 以 很 好 地 工作 。 很 多 机 器 下 都 是 这 种 情况 。 

宏 LDSIGN .Putfld 在 测试 浮 点 值 时 也 同样 严密 。 对 于 像 NaN 或 者 Inf 这 样 的 特殊 


编码 值 需要 特殊 的 处 理 方 式 ， 以 免 在 _Putf1d 内 部 发 生 异 常 。 因 此 ， 宏 LD- 
SIGN 使 用 半数 值 方法 测试 long double 的 符号 位 。 它 效仿 了 7.4 节 的 宏 DSIGN。 
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图 12-50 


xlitob.c 


指向 void 
的 指针 


函数 Ldtob 


/* Litob function */ 
#include <stdlib.h> 
#include <string.h> 
#include "xmath.h" 
finclude "xstdio.h" 


static char ldigs[] 
static char udigs[] 


"0123456789abcdef "; 
"0123456789ABCDEF "; 


tou 


void _Litob(_Pft *px, char code) 


{ /* convert unsigned long to text */ 
char ac[24]; /* safe for 64-bit integers */ 
char *digs == code == 'x' ? udigs : ldigs; 
int base = code == 'o' ? 8 : 

code != 'x' && code !- 'X' ? 10 : 16; 


int i - sizeof (ac); 
unsigned long ulval - px-»v.li; 


if ((code == 'd' |j code == 'i' ) && px-»v.li < 0) 
ulval = -ulval; /* safe against overflow 
*/ 
if (ulval || px->prec) 
ac[--i] = digs[ulval % base]; 


px->v.ii = ulval / base; 

while (0 « px-»v.li && O « i) 
{ /* convert digits */ 
ldiv t qr = ldiv(px->v.1li, base); 


px-»v.li = qr.quot; 
ac[--i] = digsI[qr.rem]; 
} 

px->nl = sizeof (ac) - i; 

memcpy (px->s , &ac[i], px-»n1); 

if (px->nl < px->prec) 
px->nz0 = px-»prec - px-»nl; 

if (px->prec < 0 && (px->flags & ( FMI| FZE)) ==  FZE 
&& 0 < (i = px->width - px->n0 - px->nz0 - px->n1)) 
px->nz0 += i; 


一 个 更 有 问题 的 实现 决策 是 关于 0 这 个 转换 说 明 符 ， 在 C 标准 中 ， 它 打 
EJ void 指针 的 方式 是 留 给 实现 定义 的 。 在 这 个 实现 中 ， 我 选择 把 这 个 指针 强 
制 转换 为 指向 long 的 指针 ， 然 后 把 它 作为 一 个 十 六 进 制 整数 打印 出 来 。 然 
而 ， 指 针 和 整数 不 同 ， 不 能 保证 这 种 做 法 在 一 个 给 定 的 体系 结构 下 正确 或 者 
安全 。 在 某 些 机 器 下 ， 这 里 的 代码 可 能 必须 经 过 修改 才能 有 效 地 工作 。 

_Litob 本 身 相当 地 简单 。 为 了 安全 性 ， 它 使 用 unsigned long 算术 转换 
一 个 数字 。 然 后 ， 它 使 用 long 算术 转换 剩 下 的 所 有 数字 ， 这 样 在 很 多 计算 机 体系 
结构 下 执行 速度 都 会 很 快 。 这 个 函数 在 内 部 缓冲 中 从 右 到 左 处理 数 字 ， 然 后 把 它 
们 复制 到 从 _Printf 继承 来 的 缓冲 中 。 注 意 函 数 计 算数 字 前 面 的 零 的 数目 的 方 
法 。 它 保证 零 的 数目 至 少 和 要 求 的 精度 一 样 多 ， 但 是 如 果 需 要 左 移 ， 可 以 更 多 。 

_Putfld 通 过 调用 了 晴 数 _LGtob 来 执行 所 有 的 浮 点 转换 。 图 12-51 Œ 
示 了 文件 xldtob.c, EEX T MÅ Ldtob. TAG px->v.ld 类 型 为 
long double， 该 类 型 足够 表示 任何 浮 点 值 。 


图 12-51 
xldtob.c 


«stdio.h» 


/* _Ldtob function */ 
#include «float.h» 
#include <stdlib.h> 
#include <string.h> 
#include "xmath.h" 

finclude "xstdio.h" 


/* macros */ 
#define NDIG 8 


/* static data */ 


static const long double pows[] = { 
leiL, le2L, le4L, 1e8L, lel6L, 1e32L, 

dif 0x100 < | LBIAS /* assume IEEE 754 8- or 10-byte */ 
1e64L, 1e128L, 1e256L, 

#if _DLONG /* assume IEEE 754 10-byte */ 
1e512L, 1e1024L, 1e2048L, 164096L, 

#endif 

#endif 
3; 


void Ldtob( Pft *px, char code) 
{ /* convert long double to text */ 
char ac[32]; 
char *p = ac; 
long double ldval = px-»v.1d; 
short errx, nsig, xexp; 


if (px-»prec « 0) 
px->prec = 6; 

else if (px->prec == 0 && (code == 'g' || code == 'G')) 
px->prec = 1; 

if (0 < (errx =_Ldunscale(&xexp, &px->v.1d))) 


{ /* x == NaN, x == INF */ 
memcpy (px->s, errx == NAN ? "NaN" : "Inf", px->nl = 3); 
return; 
} 

else if (0 == errx) /* x == 0 */ 
nsig = 0, xexp = 0; 

else 
{ /* 0 < |x|, convert it */ 

{ /* scale ldval to --10^(NDIG/2) */ 

int i, n; 


if (1dval < 0.0) 


ldval = -ldval; 
if ((xexp = xexp * 30103L / 100000L - NDIG/2) < 0) 
{ /* scale up */ 
n = (-xexp + (NDIG/2-1)) & ~(NDIG/2-1) , xexp = -n; 
for (i = 0; 0 < n; n >>= 1, ++i) 
if (n & 1) 


ldval *= pows[i]; 
} 
else if (0 < xexp) 
{ /* scale down */ 


图 12-51 
GE) 
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long double factor - 1.0; 
xexp &- -(NDIG/2-1); 
for (n = xexp, i = 0; 0 < n; n >>= 1, ++i) 
if (n & 1) 


factor *- pows[i]: 


ldval /= factor; 
) 
} 


{ /* convert significant digits */ 
int gen = px->prec 
+ {code == 'Ë' ? xexp + 2+NDIG 2+NDIG/2) ; 
if (LDBL_DIG+NDIG/2 < gen) 
gen = LDBL_DIG+NDIG/2; 
for (*p++ = '0'; 0 < gen && 0.0 < 1dval; p += NDIG) 
{ /* convert NDIG at a time */ 
int j; 
long lo = (long) ldval; 
if (0 < (gen -= NDIG)) 


ldval = (ldval - (long double)lo) *1e8L; 


for (p += NDIG, j 


= NDIG; 0 < lo && 0 <= --j; ) 


{ /* convert NDIG digits */ 
ldiv t gr = ldiv(lo, 10); 
*--p = Ort. rem + '0' , lo = gr.quot; 
} 
while (0 <= --j) 
*--p = '0'; 
} 
gen = p - &ac[1]; 
for (p = &ac[1], xexp += NDIG-1; *p == '0'; ++p} 
--gen, --xexp; /* correct xexp */ 
nsig = px-»prec + (code == 'f' ? xexp + 1 
code == "ei || code-- "Ei ? 1: 0); 


if (gen « nsig) 
nsig - gen; 

if (0 « nsig) 
{ 
const char drop 


/* round and strip trailing zeros */ 


= nsig < gen && '5' <= p[nsig] ? '9' : '0'; 
int n; 
for (n = nsig; p[--n] == drop; ) 
--nsig; 
if (drop == '9') 
++p[n]; 
if (n < 0) 
--p, ++nsig, ++xexp; 
) 
H 
) 
 Genld(px, code, p, nsig, xexp); 


) 
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AE 


E 


US <stdio.h> 


ERA _Ldtob 位 于 <stdio.h> 和 <math.h> 之 间 。 它 包含 了 头 文件 "xstdio.h" 
和 "math.h" 来 获得 所 有 需要 的 参数 。 它 也 共享 了 «math.h» 的 这 个 实现 中 的 
很 多 假设 。 例 如 ， 数 据 对 象 pows 包含 了 所 有 形式 为 107 的 可 表示 的 浮 点 值 。 
我 选择 了 区 分 以 下 3 个 区 间 。 

o 最 小 的 区 间 ， 最 大 到 107. 

O IEEE 754 的 8 字 节 表示 ， 最 大 到 10 77, 

O IEEE 754 的 10 字 节 表示 ， 最 大 到 10 95, 
有 时 可 能 需要 修改 这 个 表 来 适应 其 他 实现 。 

. Ldtob 使 用 "xmath.bh" 中 声明 的 函数 Ldunscale 来 测试 和 拆 分 浮 点 
值 。 对 一 个 存储 在 px->v.1da 中 的 有 限 值 x 来 说 ，_LGunscale 用 小 数 /来 
AE x, 3X 8 | 了 | 在 半 开 区 间 [0.5,1.0) A; 把 指数 e 存储 在 xexp 中 ， 这 里 x 
= 了 f*2<。 在 这 种 情况 下 ，_Ldtob 对 了 没有 任何 作用 。 它 只 使 用 e 来 把 x 现在 
在 laval H) 扩大 到 一 个 合适 的 区 间 。 

如 果 _Ldunscale 报告 x 为 非 数 ，_Latcb 就 生成 NaN。 如 果 x 是 无 穷 大 ， 


函数 则 生成 Inf. C 标准 没有 定义 遇 到 非 数 或 者 无 穷 大 时 会 出 现 什么 情况 ， 


所 以 产生 这 些 序列 是 一 个 合理 的 扩充 。 

_Latob 通过 把 long double 类 型 的 laval 的 值 赋 给 long 类 型 的 1o， 一 次 
PET 8 (ONDIG) AMF. long 类 型 至 少 可 以 表示 大 到 10 的 值 。 通 常 ， 把 
一 个 long 类 型 值 转换 为 8 位 十 进 制 数 要 比 转换 任何 浮 点 类 型 快 得 多 。 函 数 也 
尽量 只 转换 那些 转换 说 明 符 要 求 的 数字 。 

要 达到 转换 的 这 些 节 省 机 制 需要 合理 的 组 织 。 注 意 下 面 这 个 特殊 的 赋值 
语句 : 

xexp = xexp * 30103L / 100000L - NDIG/2; 

EM laval) 要 求 的 预 引 比 例 因 子 进行 了 充分 的 评估 。 用 户 希 望 乘 以 pows 
的 元 素 的 最 小 数目 ， 那 么 最 后 laval 一 定 要 比 10 小。 用 户 还 希望 第 一 组 的 
8 个 数字 至 少 有 4 个 非 零 数字 ， 那 么 必须 使 用 实际 的 比例 因子 (在 xexp 中 ) 
来 生成 一 个 合适 的 指数 。 这 个 表达 式 通 过 把 e RA oe, Q2) 来 开始 那个 过 程 。 
它 也 允许 小 数 点 的 左面 有 4 位 数字 。 函 数 然后 相应 地 修改 Laval. 


下 一 个 特殊 的 近似 值 是 下 面 的 初始 化 式 : 
int gen = px-prec 
+ (code == 'f' ? xexp + 2+NDIG : 2+NDIG/2); 


它 对 要 转换 的 数字 的 位 数 进 行 充分 的 评估 ， 它 允许 至 少 一 个 额外 的 数字 对 结 
果 进 行 舍 入 处 理 。 对 比 之 下 ， 后 面 的 转换 就 相当 简单 了 。 转 换 最 后 丢弃 尾部 
的 零 ， 并 相应 地 调整 gen 和 xexp。 

下 一 步 是 计算 转换 说 明 要 求 的 有 效 数 字 nsig 的 位 数 。( 直 到 获得 了 xexp 
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函数 Genld 


格式 化 输入 


的 准确 值 之 后 才 可 以 这 样 做 。) 剩 下 的 工作 就 是 把 nsig 缩减 到 给 出 的 有 效 数 
字 的 数目 。 如 果 nsig 比 gen 小 ， 函 数 也 要 对 结果 进行 舍 人 处 理 。_Ldtob 最 
后 通过 调用 函数 Genla 来 结束 。 这 样 就 省 去 了 对 转换 后 的 值 进行 修改 来 满 
足 各 种 转换 说 明 符 的 具体 需要 。 

图 12-52 显示 了 文件 xgenldq.c， 它 定义 了 函数 _Genld。 该 函数 在 Printf 
提供 的 缓冲 区 中 产生 各 种 浮 点 转换 的 最 后 表示 。 它 按照 从 左 到 右 的 顺序 ， 从 
—Ldtob 的 缓冲 中 复制 需要 的 字符 来 完成 这 项 操作 。 这 里 的 逻辑 宛 长 而 严密 ， 但 
没有 什么 技巧 。 有 一 点 特别 的 是 ，xexp 会 因为 上 转换 说 明 符 而 改变 它 的 含义 。 
它 变 成 对 开头 的 数字 的 计数 ， 而 不 是 要 显示 的 指数 。 类 似 地 ，px->prec 为 g 转 
换 说 明 符 改变 了 它 的 含义 。 它 变 成 了 小 数 部 分 数字 的 计数 ， 而 不 是 总 的 精度 。 

那 就 是 打印 函数 的 最 后 一 部 分 代码 。 正 如 你 所 看 到 的 ， 转 换 浮 点 值 花费 
了 相当 多 的 努力 ， 它 也 包含 了 大 量 的 代码 。 小 型 计算 机 下 的 标准 C 的 实现 可 
能 不 需要 打印 浮 点 值 。 这 种 情况 下 ， 可 以 通过 提供 Puttla 的 一 个 修改 的 版 
本 来 大 幅度 地 缩减 程序 的 大 小 。 删 除 浮 点 转换 的 代码 ， 这 样 就 不 需要 再 连接 
_Ldtob 和 它 的 附属 函数 ， 也 不 用 连接 很 多 其 他 提供 浮 点 支持 的 函数 。 

然而 ， 为 同一 个 函数 编写 多 个 版 本 早晚 会 造成 混乱 。 

有 3 个 函数 执行 格式 化 输入 (扫描 函数 )， 它 们 都 调用 一 个 公共 函数 
_Scanf， 这 个 函数 声明 如 下 : 


int _Scanf (void *(*pfn) (void *, int), void *arg, 
const char *fmt, va list ap); 


它 的 参数 包含 如 下 几 个 : 
口 _ pfn- 指向 函数 的 指针 ， 调 用 该 函数 来 获得 字符 。 
o arg 一 一 一 个 通用 的 数据 对 象 指针 ， 作 为 那个 获取 函数 的 其 中 一 个 参 
数 传递 。 
O fmt 一 指向 格式 串 的 指针 。 


D ap 一 一 指向 上 下 文 信息 的 指针 ， 该 信息 描述 了 一 个 可 变 参 数 表 。 
若 获取 函数 的 第 二 个 参数 值 为 WANT (在 "xstGio.h" 中 定义 ， 是 一 个 与 所 有 
字符 编码 和 EOF 都 不 同 的 值 )， 则 它 就 获得 下 一 个 要 扫描 的 字符 。 否 则 ， 这 
个 项 狗 就 把 第 二 个 参数 作为 要 回 误 的 字符 对 待 。 函 数 和 失败 时 返 同 BOF. — 
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图 12-52 /* _Genld function */ ` | 
xgenld.c *include «locale.h» 
#include <string.h> 
#include "xstdio.h" 


void _Genld(_Pft *px, char code, char *p, short nsig, 
short xexp) 
{ /* generate long double text */ 
const char point = localeconv()->decimal_point[0]; 


if (msig <= 0) 


nsig = 1, p = "0"; 
if (code == 'f' || (code == 'g' || code == 'G') 
&& -4 <= xexp && xexp < px->prec) 
{ /* 'f' format */ 
T-XeXp; /* change to leading digit count */ 
if (code !- 'f') 
{ /* fixup for 'g' */ 
if (!(px->flags & _FNO) && nsig < px->prec) 
px->prec = nsig; 
if ((px->prec -= xexp) < 0) 
px->prec = 0; 
} 
if (xexp <= 0) 
{ /* digits only to right of point */ 
px->s[px->nl++] = '0'; 
if (0 < px->prec || px->flags & _FNO) 
px->s[px->nl++] = point; 
if (px->prec < -xexp) 
xexp = -px->prec; 
px->nzl = -xexp; 


px->prec += xexp; 
if (px->prec < nsig) 
nsig = px->prec; 


memcpy(&px-»s[px-»n1] , p, px->n2 = nsig); 
px->nz2 = px-»prec - nsig; 
) 
else if (nsig < xexp) 
{ /* zeros before point */ 


memcpy (&px->s[px->n1], p, nsig); 
px->nl += nsig; 
px->nzl = xexp - nsig; 
if (0 < px->prec || px->flags & _FNO) 
px->s [px->nl] = point, ++px->n2; 

px->nz2 = px->prec; 
} 

else 
{ /* enough digits before point */ 
memcpy (&px->s[px->nl1], p, xexp); 
px->nl += xexp; 


nsig -= xexp; 
if (0 < px->prec || px->flags & _FNO) 
px->s [px->nl++] = point; 


if (px->prec < nsig) 
nsig = px->prec; 
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图 12-52 memcpy (&px->s [px->nl], p + xexp, nsig); 
( 续 ) px->nl += nsig; 
px-»nzl = px->prec - nsig; 


) 


) 
else 
{ /* 'e' format */ 
if (code == 'g' || code == 'G') 
{ /* fixup for 'g' */ 
if (nsig « px-»prec) 
px-»prec - nsig; 
if (--px-»prec « 0) 
px->prec = 0; 
code = code == 'g' ? 'e' : "Ei: 
) 
px->s[px->nl++] = *p++; 


if (0 < px->prec |] px->flags & FNO) 
px->s[px->n1++] = point; 
if (0 < px->prec) 
{ /* put fraction digits */ 
if (px->prec < --nsig) 
nsig = px->prec; 
memcpy (&px->s[px->nl], p, nsig); 
px->nl += nsig; 
px->nzl = px->prec - nsig; 
) 
p = &px->s[px->nl]; /* put exponent */ 
*p++ = code; 
if (0 «- xexp) 
*pt+ = '+'; 
else 
{ /* negative exponent */ 
*p++ = '-'; 
xexp -Xexp; 
H 
if (100 «- xexp) 
{ /* put oversize exponent */ 
if (1000 <= xexp) 
*p++ = xexp / 1000 + '0', xexp %= 1000; 
*p++ = xexp / 100 + '0', xexp %= 100; 


H 


H 
*p++ = xexp / 10 + '0', xexp %= 10; 
*p++ = xexp + '0'; 
px->n2 = p - &px->s[px->n1]; 
} 
if ((px->flags & ( FMI| FZE)) == _FZE) 
{ /* pad with leading zeros */ 
int n = px->n0 + px->nl + px->nzl + px-»n2 + px->nz2; 


if (n <px~>width) 
px-»nzÜ = px->width - n; 


316 


*€* 12% <stdio.h> 


图 12-53 


fscanf.c 


图 12-54 


scanf.c 


[ys fscanf function */ 
finclude "xstdio.h" 


static int scin(void *str, int ch) 
{ /* get or put a character */ 
if (ch == _WANT) 
return (fgetc( (FILE *)str)); 
else if (0 <= ch) 
return (ungetc(ch, (FILE *)str)); 
else 
return (ch); 


int (fscanf) (FILE *str, const char *fmt, ...) 
{ /* read formatted from stream */ 
int ans; 


va list ap; 


va startí(ap, fmt); 
ans = Scanf(&scin, str, fmt, ap); 
va, end(ap); 


return (ans); 


} 口 


/* scanf function */ 
#include "xstdio.h" 


static int scin(void *str, int ch) 
{ /* get or put a character */ 
if (ch == _WANT) 
return (fgetc((FILE *)str)); 
else if (0 <= ch) 
return (ungetc(ch, (FILE *)str)); 
else 


return (ch); 


int (scanf) (const char *fmt, ...) 
{ /* read formatted from stdin */ 
int ans; 


va_list ap; 


va_start(ap, fmt); 
ans = _Scanf (&scin, stdin, fmt, ap); 


va end(ap); 
return (ans); 


} a 
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图 12-55 


sscanf.c 


PRAY _scanf 


类 型 søt 


/* sscanf function */ 
finclude "xstdio.h" 


static int scin(void *str, int ch) 


{ /* get or put a character */ 
char *s = *(char **)str; 


if (ch -- WANT) 
if (*s == '\0') 
return (EOF); 
else 
{ /* deliver a character */ 


* {char **)str = s + 1; 
return (*s); 
} 
else if (0 <= ch) 
*(char **)str = s - 1; 
return (ch); 


} 

int (sscanf) (const char *buf, const char *fmt, e.) 
{ /* read formatted from string */ 
int ans; 


va_list ap; 


va_start(ap, fmt); 

ans = Scanf(&scin, (void **)&buf, fmt, ap); 
va_end(ap); 

return (ans); 


} 口 


图 12-56 显示 了 文件 xscanf.c， 它 定义 了 函数 _scanf， 这 个 函数 完成 
所 有 的 工作 。 


Scant 把 各 个 信息 位 都 放 到 一 个 stt 类 型 的 结构 x 中 。 附 属 函 数 填充 
附加 的 信息 。 当 它们 学 成 一 个 给 定 的 转换 说 明 符 的 所 有 工作 的 时 候 ， -Scanf 
通过 检查 x 的 内 容 ， 就 会 知道 已 经 扫描 了 多 少 个 字符 和 最 后 一 个 转换 说 明 符 
是 否 存 储 了 转换 后 的 值 。 头 文件 "xstdio.h" 包含 以 下 的 类 型 定义 : 


typedef struct ( 
int (*pfn)(void *, int); 
void *arg; 
va list ap; 
int nchar, nget, width; 
char noconv, qual, stored; 
) Sft; 


它 的 成 员 如 下 : 
pfr 


ua 


FEM TERCERA HS ET 

arg 一 一 保存 获取 函数 的 一 般 参 数 。 

ap 一 一 保存 可 变 参 数 表 的 上 上下文 信 息 。 

对 目前 为 止 扫 描 的 字符 的 总 数 进行 计数 。 


a da 


nchar 


AK 
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图 12-56 


/* _Scanf function */ 


xscanf.c 


include 
#include 
#include 
#include 
#include 


int _Sca 


<ctype.h> 

<limits.h> 
<stdlib.h> 
<string.h> 
"xstdio.h" 
nf(int (*pfn) (void *, 


int), void *arg, 


const char *fmt, va list ap) 


{ 
const char *s; 
int nconv = 0; 


_Sft x; 
x.pfn - pfn; 
x.arg - arg; 
x.ap - ap; 
x.nchar - 0; 
for (s = fmt; ; ++S) 
{ /* parse format string */ 
int ch; 
{ /* match any literal or white-space 
int n; 
wchar t wc; 
 Mbsave state = (0); 
while (0 < (n = Mbtowc(&wc, s, MB CUR MAX, &state))) 
{ /* check type of multibyte char 
S += n; 
if (wc == '$') 
break; 
else if (wc «- UCHAR MAX && isspace(wc)) 
( /* match any white-space 
while (isspace(*s)) 
TtS; 
while (isspace(ch - GET(&x))) 
UNGET(&x, ch); 
} 
else /* match literal text 
for (s -= n; 0 <= --n; ) 
if (ich = GET(&x)) ! = *s++) 
{ /* bad match 
UNGET (&x, ch); 
return (nconv); 
} 
} 
if (*s == '\0') 
return (nconv); 
} 
{ /* process a conversion specifier */ 


/* read formatted */ 
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图 12-56 
(4) 


x.noconv = *g == '*' ? *g++ : '\O'; 
for (x.width = 0; isdigit(*s); ++s) 
if (x.width < WMAX) 


x.width = x.width * 10 + *s - '0'; 
x.qual = strchr("hlL". *s) ? *s++ : "NI: 
if (!strchr("en[", *s)) 


/* match leading white-space */ 
while (isspace(ch = GET(&x))) 


UNGET(&x, ch); 
) 
if ((s = Getfld(&x, s)) == NULL) 
return (0 < nconv ? nconv : EOF); 
if (x.stored) 


) ++nconv; 

) 
) m 
口 nget 一 一 对 目前 为 I 上 宏 GETN (下 面 会 讲 ) 扫描 的 字符 的 个 数 进 行 计数 。 
CO _ width 一 一 保存 转换 说 明 的 字段 宽度 如果 没有 的 话 为 0)。 
C) noconv 一 一 保存 一 个 非 零 值 ('*') 来 取消 存储 转换 值 。 
口 _qual 一 一 保存 转换 说 明 的 大 小 限定 符 〈h、1、L)。 
O stored 一 一 通过 scanf 的 一 个 存储 转换 值 的 附属 函数 设置 为 非 震 。 


<stdlib.h> 中 声明 的 内 部 函数 _Mbtowc， 使 用 用 户 每 次 调用 时 提供 的 
_Mbstate 类 型 的 状态 记忆 ， 把 格式 作为 一 个 多 字 节 串 进行 分 析 。 它 遇 到 的 问 
题 和 _Printf 相同 ，12.4 节 有 相应 的 描述 。 然 而 ，_Scanf 不 但 要 区 分 百 分 
号 字符 而 且 要 区 分 空白 。 假 设 任何 可 以 以 unsigned char 类 型 存储 的 宽 字 节 字 
符 编码 都 可 以 通过 isspace 得 到 正确 的 判断 。 在 当前 的 C 标准 中 这 肯定 是 正 
确 的 。 但 在 "NE! 和 TD' At' 不 一 定 等 价 的 环境 下 ， 修 改 起 来 就 比较 麻烦 了 。 

和 _Printf 一样 ，_Scanf 也 要 担心 转换 说 明 符 之 间 的 字面 量 文 本 中 的 
多 字 节 字符 。 一 旦 它 发 现 了 很 大 一 部 分 字面 量 文本 ， 它 就 传送 这 样 的 字符 直 
到 遇 到 百 分 号 ， 但 不 包括 百 分 号 。 它 匹配 空白 的 方式 很 有 趣 。 并 且 只 有 当 扫 
描 的 文本 和 格式 中 的 字面 量 文本 的 转移 序列 相同 时 ， 它 才 匹 配 多 字 节 字符 。 
这 两 种 特性 都 会 限制 扫描 函数 的 功能 ， 但 它们 又 都 是 遗传 的 ， 那 就 是 C 标准 
说 明 扫描 函数 的 方式 。 

宏 GET 用 来 获得 一 个 字符 ， 宏 UNGET 用 来 把 第 一 个 不 想 要 的 字符 回 退 ， 
要 注意 它们 的 使 用 方法 。 这 两 个 宏 都 在 "xstdio.n" 中 定义 ， 因 为 scant 的 
附属 函数 也 要 通过 同样 的 方式 获得 字符 。 两 个 宏 的 定义 如 下 : 

#define GET (px) (++(px)->nchar, (*(px)->pfn) ((px)->arg,_ WANT)) 


#define UNGET(px, ch) \ 
(-- (px) ->nechar, (*(px)->pfn) ((px)->arg, ch)) 


也 可 以 把 这 些 操作 作为 函数 实现 ， 我 把 它们 定义 为 宏 主 要 是 为 了 提高 性 能 。 
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GETN 3k X fff "xstdio.h" 定义 了 两 个 和 这 些 联系 紧密 的 附加 的 宏 。 可 以 把 一 

UNGETN 个 字符 计数 存储 在 x.nget 中 来 定义 用 户 希望 扫描 的 字段 的 最 大 宽度 。 使 用 

宏 GETN 来 代替 GET, Hj UNGETN 代替 UNGET。 一 日 字段 用 完了 ， GETN 就 生成 
特殊 的 编码 _WeNT， 这 样 就 简化 了 几 个 地 方 的 逻辑 。 这 两 个 宏 的 定义 为 : 


#define GETN(px) (0 < = -- (px) -> nget ? GET(px) : WANT) 
#define UNGETN(px, ch) {if (ch) !- WANT) UNGET(px, ch); ) 


头 文 件 这 是 对 头 文件 "xstdio.h" 最 后 的 主要 贡献 。 图 12-57 显示 了 文件 xstdio.h. 
"xstdio.h" 到 了 这 个 时 候 ， 它 应 该 已 经 非常 明确 了 。 在 这 里 把 它 给 出 来 只 是 为 了 保持 完整 性 。 


图 12-57 [/ xstdio.h internal header */ 
xstdio.h finclude «stdarg.h» 

finclude <stdio.h> 

/* bits for Mode in FILE */ 

#define _MOPENR 0x1 

#define _MOPENW 0x2 

#define _MOPENA 0x4 

#define _MTRUNC 0x8 

#define _MCREAT 0x10 

#define _MBIN 0x20 

#define | MALBUF 0x40 

#define _MALFIL 0x80 

#define _MEOF 0x100 

#define _MERR 0x200 

#define _MLBF 0x400 

#define _MNBF 0x800 

#define _MREAD 0x1000 


#define _MWRITE 0x2000 
/* codes for _Printf and _Scanf */ 
#define FSP 0x01 
#define _FPL 0x02 
#define _FMI 0x04 
#define _FNO 0x08 
#define _FZE 0x10 


#define _WMAX 999 
#define _WANT (EOF-1) 
/* macros for  Scanf */ 


#define FMAX 512 /* widest supported field */ 
#define GET(px) (++(px) ->nchar, (* (px) ->pfn) ((px)->arg, . WANT)) 
#define GETN (px) (0 <= --(px)->nget ? GET(px) : WANT) 


#define UNGET (px, ch) \ 
(--(px)-»nchar, (*(px)-»p£n)((px)-»arg, ch)) 
#define UNGETN(px, ch) {if ((ch) ! = WANT) UNGET(px, ch); ) 
/* type definitions */ 
typedef struct ( 
union ( 
long li; 
long double ld; 
) v; 
char za: 
int n0, nz0, nl, nzl, n2, nz2, prec, width; 
Size t nchar; 
unsigned int flags; 
char qual; 
}  Pft; 
typedef struct ( 
int (*pfn)(void *, int); 
void *arg; 
va list ap; 
int nchar, nget, width; 
char noconv, qual, stored; 


) Sft; 
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图 12-57 

GE) 

函数 Getfld 

| å Getint 
指向 void 的 
指针 

函数 
 Getfloat 


/* declarations */ 
FILE * Foprep(const char *, const char *, FILE *); 
int _Fopen(const char *, unsigned int, const char zi: 
int Frprep(FILE *); 
int Ftmpnam(char *, int); 
int _Fwprep(FILE zi: 
void Genld( Pft *, char, char *, short, short); 
const char * Getfld( Sft *, const char *); 
int Getfloat( Sft *); 
int Getint ( Sft *, char) ; 
void  Ldtob( Pft *, char); 
void Litob( Pft *, char); 
int  Printf(void *(*)(void *, const char *, size t), 
void *, const char *, va list); 
void Putfld( Pft *, va list *, char, char *); 
int _Scanf(int (*)(void *, int), 
void *, const char *, va list); o 


— H _scanf 在 一 个 格式 中 遇 到 百 分 号 ， 它 就 开始 分 析 后 面 的 转换 说 明 
符 。 这 个 任务 非常 简单 ， 因 为 扫描 转换 说 明 符 的 选择 很 少 。 对 于 几乎 所 有 的 
转换 说 明 符 ，_Scanf 也 跳 过 前 面 的 空白 ， 只 有 少数 几 个 除外 。 

图 12-58 显示 了 文件 xgetfld.c, EMM ST ARM Getfld, Scanf Å 
FN PR DOE UDE rr DH. iC RMU — TAR KAI switch 语句 组 成 ， 
V switch 语句 分 组 处 理 转 换 说 明 符 。_Getf1ld 从 可 变 参 数 表 中 搜集 需要 的 参 
数 。( 附 属 函 数 也 搜集 需要 的 参数 .) 它 直接 处 理 只 包含 文本 的 任何 转换 。 

函数 Get f la 通过 调用 函数 _Getint 执行 所 有 的 整数 转换 。 图 12-59 
显示 了 文件 xgetint.c, EMT PAM _Getint。 该 函数 搜集 和 一 个 整数 值 
的 适当 模式 匹配 的 所 有 字符 ， 然 后 调用 <stdlib.h> 中 声明 的 strtol 或 者 
strtoul 来 转换 字段 。 头 文件 "xstdio.h" 把 宏 FMAX 定义 为 512， 这 就 有 点 
超出 了 C 标准 要 求 的 扫描 函数 必须 转换 的 最 长 的 字段 长 度 。 

p 转换 说 明 符 和 打印 函数 中 这 个 相同 的 转换 说 明 符 含义 相同 。 当 然 ，C 
标准 中 ， 扫 描 void 指针 的 方式 也 是 留 给 实现 定义 的 。 在 这 个 实现 中 ， 我 选择 
把 字段 作为 一 个 unsigned long 类 型 转换 ， 然 后 把 它 存 储 为 一 个 指向 void 的 指 
针 。 我 再 次 强调 一 下 ， 这 种 做 法 不 能 保证 在 一 个 给 定 的 体系 结构 下 正确 或 者 
安全 。 在 某 些 机 器 下 ， 这 里 的 代码 可 能 必须 经 过 修改 才能 有 效 地 工作 。 

函数 Getf la 通过 调用 _Getf1oat 执行 所 有 的 浮 点 转换 。 图 12-60 显 
示 了 文件 xgetf1oat.c， 这 个 文件 定义 了 清 数 _Getf1oat。 它 搜集 和 一 个 浮 
点 值 的 适当 模式 匹配 的 所 有 字符 ， 然 后 调用 <stdlib.h> 中 声明 的 strtod 来 
转换 字段 。 注 意 ， 即 使 是 一 个 long double 类 型 的 存储 值 也 要 用 strtod 转换 。 
如 果 long double 的 精度 或 者 范围 比 double 大 ， 那 么 这 样 可 能 会 限制 能 正确 转 
换 的 值 的 范围 。 然 而 ， 这 都 是 C 标准 要 求 的 。 当 然 ， 也 可 以 使 用 一 个 可 接受 
的 扩展 ， 编 写 一 个 “将 字符 串 转 换 为 long double 类 型 ”的 函数 〈 当 然 要 使 用 
私有 名 字 )。 这 里 我 选择 不 承担 这 些 额外 的 工作 。 
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图 12-58 /* Getfld function */ 
xgetfld.c #include <ctype.h> 


#include «limits.h» 
#include <string.h> 
#include "xstdio.h" 


const char *_Getfld(_Sft *px, const char *s) 


{ /* convert a field */ 
int ch; 
char *p; 


px->stored = 0; 
switch (*s) 
{ /* switch on conversion specifier */ 
‘ot: /* convert an array of chars */ 

if (px->width == 0) 

px->width = 1; 
p = va_arg(px->ap, char *); 
for (; 0 < px->width; --px->width) 

if ((ch = GET(px)) < 0) 

return (NULL); 

else if (!px->noconv) 

ch, px->stored = 1; 


case 


*p++ = 
break; 
‘pt: 
'd'; case 'i': 
'u': case 'x': case 
if (_Getint(px, *s)) 
return (NULL); 
break; 
'e': case 'E': 
'g': case 'G': 
if ( Getfloat(px)) 


case /* convert a pointer */ 
case 


case 


EIER 
EI 


case 


/* convert an integer */ 


case case 'f': 
case 
/* convert a floating 
*/ 
return (NULL); 

break; 

‘n't: 
if (px->quai == 'h') 


case /* return output count */ 


*va arg(px->ap, 
else if (px->qual != 

*va argipx->ap, 
else 

*va_arg (px->ap, 
break; 

Tei: 
px->nget = 
p = va arg(px->ap, 
while (0 <= (ch = 

if (isspace(ch)) 
break; 
else if 
*ptt = 
UNGETN (px, ch); 
if (!px->noconv) 
*p++ = "NO" 


case 


ch; 


break; 


px->width <= 0 ? INT MAX 
char *); 
GETN (px) ) ) 


short *) - 
'1') 
int *) 


px->nchar; 
= px->nchar; 
long *) 


= px->nchar; 


/* convert a string */ 
px->width; 


(!px-»noconv) 


px->stored - 1; 


图 12-58 
(48) 
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case "Sr: /* match a '$' */ 
if ((ch = GET(px)) == '$') 
break; 
UNGET (px,ch); 
return (NULL); 
case '[': 


{ /* convert a scan set */ 
char comp = *++S == '^' ? *g44+ : '\Q! 
const char *t = strchr(*s == ']' ? s 41: s, ']'); 
size tn=t - Si 
if (t == NULL) 


return (NULL); /* undefined */ 
px- >nget = px->width <= 0 ? INT_MAX : px->width; 
= va “arg (px- >ap, char *); 
Kl (0 <= (ch = GETN(px))) 
if (!comp && !memchr(s, ch, n) 
|] comp && memchr(s, ch, n)) 
break; 


else if (!px-»noconv) 
*p++ = Ch; 
UNGETN (px, ch); 
if (!px-»noconv) 
*P++ = 'NO', px-»stored = 1; 
s = t; 
} 
break; 
default : /* undefined specifier, quit */ 


return (NULL); 
) 
return (s); 


) n 


扫描 函数 的 代码 到 这 里 就 没有 了 ， 和 打印 函数 一 样 ， 转 换 浮 点 值 也 要 付 
出 相当 多 的 努力 。 扫 描 函 数 也 涉及 了 很 多 代码 。 在 一 个 小 计算 系统 下 ， 标 准 
C 的 实现 对 扫描 浮 点 值 的 需求 可 能 比 打 印 它们 要 小 。 如 果 需 要 扫描 函数 但 是 
不 需要 浮 点 支持 ， 就 可 以 通过 提供 gettla 的 修改 的 版 本 来 大 幅度 缩减 程序 
的 大 小 。 这 样 的 方式 也 适用 于 本 节 前 面 讨论 的 打印 函数 。 


12.5 <stdio.h> 的 测试 


程序 


tstdiol.c 


头 文件 <stdio.h> 声明 的 函数 太 多 了 而 不 能 一 次 测试 全 部 。( 至 少 在 本 
书 中 对 C 源 文 件 大 小 的 限制 下 不 能 .我 选择 在 一 个 测试 程序 中 执行 打印 和 
扫描 困 数 ， 另 一 个 程序 只 测试 所 有 的 低级 函数 。 

图 12-61 显示 了 文件 tstdaiol.c， 它 检查 打印 和 扫描 转换 是 否 准 确 ， 如 果 
它们 的 准确 性 不 能 保证 就 检查 其 精确 程度 。 作 为 结果 ， 它 显示 了 几 个 宏 的 值 。 
而 且 在 把 最 后 的 输出 行 连接 到 一 -起 时 ， 它 还 执行 了 冰 数 v£printf, vprintf 
和 sprintf。 对 于 这 个 实现 ， 这 个 程序 显示 类 似 下 面 的 输出 并 成 功 终止 

BUFSIZ = 512 

L tmpnam = 16 

FILENAME MAX = 64 

FOPEN MAX = 16 


TMP MAX - 32 
SUCCESS testing «stdio. h», part 1 
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ol 59 /* Getint function */ 
#include <stdlib.h> 
#include <string.h> 
#include "xstdio.h" 


int _Getint(_Sft *px, char code) 
{ /* get an integer value for _Scanf */ 
char ac [FMAX+1], *p; 
char seendig = 0; 
int ch; 
static const char digits[] 
"0123456789abcdefABCDEF"; 
static const char flit[] = "diouxXp"; 
static const char bases[] - (10, 0, 8, 10, 16, 16, 16); 
int base - bases[(const char *)strchr(flit, code) - flit]; 
int dlen; 


px->nget = px-»width <= 0 
|| FMAX < px->width ?3 FMAX : px->width; 
ac, ch = GETN(px); 


(ch == "+" || ch == '- 
*p++ = ch, ch = GETN(px); 
if (ch == '0') 
H /* match possible prefix */ 


seendig = 1; 
*p++ = ch, ch = GETN(px); 
if ((ch == 'x' || ch == 'X') 
&& (base == 0 || base == 16)) 
base = 16, *pt+ = ch, ch = GETN(px); 
else 
base = 8; 
} 
dlen =base == || base == 10 ? 10 : base == 8 ? 8 : 16+6; 
for (; memchr(digits, ch, dlen); seendig = 1) 
*p++ = ch, ch = GETN(px); ` 
UNGETN (px, ch); 
if (!seendig) 
return (-1); 
tp = '\0'; 
if (px->noconv) 
else if (code == 'd' || code == 'i') 
{ /* deliver a signed integer */ 
long lval = strtol(ac, NULL, base); 


px->stored = 1; 
if (px->qual == 'h') 
*va arg(px->ap, short zl = lval; 
else if (px->qual != '1') 
*va_arg(px->ap, int *) = lval; 
else 
*va_arg(px->ap, long *) = lval; 
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图 12-59 


else 


(E) ( /* deliver an unsigned integer */ 
unsigned long ulval = strtoul(ac, NULL, base); 


px->stored = 1; 
if (code == 'p') 

*va arg(px-»ap, void **) = (void *)ulval; 
else if (px-»qual == 'h') 

*va_arg(px->ap, unsigned short *) = ulval; 
else if (px-»qual != '1') 

*va argipx->ap, unsigned int *) = ulval; 
else ` 

*va argipx->ap, unsigned long *) = ulval; 


) 


return (0); 


J o 


程序 tstdio2.c 图 12-62 显示 了 文件 fstdio2.c。 它 检查 了 这 个 头 文 件 中 定义 的 宏 的 属 
性 ， 然 后 简单 地 执行 了 各 种 函数 。 一 个 输出 信息 来 自 对 perror 的 调用 〔 测 
试 这 个 函数 的 时 候 一 定 要 有 输出 一 一 也 可 以 制造 所 有 可 能 的 错误 )。 如 果 程 
序 成 功 执 行 ， 输 出 以 下 内 容 : 


Domain error reported as: domain error 
SUCCESS testing <stdio.h>, part 2 


12.6 参考 文献 


Brian W. Kernighan and P.J. Plauger, Software Tools (Reading, Mass.: Addison- 
Wesley, 1975). Also by the same authors, Software Tools in Pascal (Reading, 
Mass.: Addison-Wesley, 1978). 这 些 书 都 举例 说 明了 怎样 通过 实现 很 少 的 基本 
接口 函数 来 在 各 种 操作 系统 下 利用 UNIX VO 模块 。 

William D. Clinger, “How to Read Floating-Point Numbers Accurately,"Proceed- 
ings of the ACM SIGPLAN *90 Conference on Programming Language Design 
and Implementation (New York: Association for Computing Machinery, 1990, pp. 
92-101). 这 篇 文章 讨论 了 在 保持 全 精度 的 前 提 下 ， 把 文本 串 转 换 为 浮 点 表示 
的 难点 。 


Guy L. Steele, Jr. and Jon L. White, “How to Print Floating-Point Numbers 
Accurately,”Proceedings of the ACM SIGPLAN *90 Conference on Programming 
Language Design and Implementation (New York: Association for Computing 
Machinery, 1990, pp. 112-126). 这 篇 文章 和 上 一 篇 文章 出 自 同一 个 会 议 学 报 ， 
它们 刚好 相互 对 应 。 


12.7 习题 


12.1 ”你 使 用 的 操作 系统 怎样 表示 文本 文件 ? 需要 作 一 些 改动 来 和 标准 C 中 文本 流 
的 内 部 表示 相 匹配 吗 ? 
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12.2 


12.3 


12.4 


12.5 


12.6 


12.7 


12.8 


12.9 


*€$ 12% <stdio.h> 


调用 函数 vfprintf 和 vsprintf 来 编写 函数 fprintf, printf 和 sprintf, 


编号 函数 rename 的 一 个 版 本 ， 当 它 不 能 简单 地 对 文件 重 命名 时 ， 就 复制 这 
个 文件 。 成 功 地 复制 文件 之 后 要 删除 原始 文件 。 


编写 函数 remove 的 一 个 版 本 ， 使 它 只 是 对 要 删除 的 文件 重 命名 。 把 文件 放 
在 一 个 不 常用 的 目录 下 ， 或 者 用 一 个 不 会 和 文件 的 普通 命名 习惯 冲突 的 名 字 
对 它 进行 命名 。 这 种 功能 有 什么 好 处 ? 


编写 函数 tmpnam 的 一 个 版 本 ， 它 要 检查 是 否 和 已 存 的 名 字 冲 突 《〈 试 着 用 那 
个 文件 名 打开 一 个 已 存 的 文件 以 便 读 取 )。 这 个 函数 可 以 一 直 生 成 新 的 文件 
名 ， 直 到 它 不 能 打开 相应 的 文件 。 这 种 功能 有 什么 好 处 ? 如 果 两 个 并 行 执行 
的 程序 同时 调用 这 个 函数 会 发 生 什么 ? 


C 标准 中 讲 到 ,“ 实 现 的 行为 不 受 调用 函数 bmpnam 的 影响 ”( 参 考 12.2 节 )， 
怎样 做 才能 满足 这 个 要 求 ? 


为 你 使 用 的 操作 系统 实现 原 语 _Fclose, _Fopen, _Fread 和 _Fwrite。 需 要 
使 用 汇编 语言 吗 ? 


[3E] 为 一 个 操作 系统 实现 函数 _Fgetpos 和 _Fsetpos， 该 系统 使 用 回 车 加 换 
行 来 终止 每 个 文本 行 。 


[3E] 编写 一 个 函数 ， 它 把 文本 串 转换 为 long double 类 型 ， 遵 循 的 规则 和 
strtod 对 double 类 型 使 用 的 规则 (参考 13.44) 相同 。 


[ 很 难 ] 重新 设计 扫描 函数 ， 使 它们 的 用 途 更 广 。 

设计 一 种 能 使 扫描 错误 和 调用 程序 通信 的 方法 ， 使 得 它 能 实现 以 下 几 个 功 
能 : 

口 更 精确 地 确定 错误 点 ; 

O 尝试 男 一 种 转换 ; 

D 从 一 个 读 错误 中 很 好 地 恢复 。 
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图 12-60 /* Getfloat function */ 
xgetfloat.c include <ctype.h> 
include <locale.h> 
*include <stdlib.h> 
#include <string.h> 
#include "xstdio.h" 


int _Getfloat (_Sft *px) 


{ /* get a floating point value for _scanf */ 
char *p; 
int ch; 


char ac[FMAX+1]; 
char seendig = 0; 


px->nget = px->width <= 0 


|| FMAX < px->width ? FMAX : px->width; 
p = ac, ch = GETN(px); 
if (ch == "+" || ch == '-') 
*p++ = ch, ch = GETN (px); 
for (; isdigit(ch); seendig = 1) 
*p++ = ch, ch = GETN(px); 
if (ch == localeconv()-»decimal, point[01) 
*p++ = ch, ch = GETN(px) ; 
for (; isdigit(ch); seendig = 1) 
*p++ = ch, ch = GETN(px); 
if ((ch == 'e' || ch == 'E' ) && seendig) 
{ /* parse exponent */ 
*p++ = ch, ch = GETN(px); 
if (ch == '+' || ch == '-') 


*p++ = ch, ch = GETN(px); 
for (seendig = 0; isdigit(ch); seendig = 1) 
*p++ = ch, ch = GETN(px); 
} 
UNGETN (px, ch); 


if (! seendig) 
return (-1); 
tp = "NO"; 
if (!px->noconv) 
{ /* convert and store */ 


double dval = strtod(ac, NULL); 


px->stored = 1; 
if (px->qual == '1') 
*va_arg(px->ap, double *) = dval; 
else if (px->qual != 'L') 
*va arg(px->ap, float zi = dval; 
else 
*va arg(px->ap, long double *) = dval; 


} 
return (0); 


} 
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图 12-61 /* test stdio functions, part 1 */ 
tstdiol.c #include «assert.h» 
finclude «errno.h» 
#include «float.h» 
#include <math.h 
#include <stdarg.h> 
#include <stdio.h> 
#include <string.h> 


static void vfp(const char *fmt, ...) 


{ /* test vfprintf */ 
va_list ap; 


va_start(ap, fmt); 
vfprintf(stdout, fmt, ap); 
va end(ap); 

) 


static void vp(const char *fmt, ...) 
{ /* test vprintf */ 
va_list ap; 


va_start(ap, fmt); 
vprintf(fmt, ap); 
va_end (ap); 

} 


static void vsp(char *s, const char *fmt, ...) 
{ /* test vsprintf */ 
va_list ap; 


va_start(ap, fmt); 
vsprintf(s, fmt, ap); 
va, end (ap) ; 


) 


int main() 
{ /* test basic workings of stdio functions */ 
char buf[32], ch; 
double db; 
float £1; 
int in; 
long 10; 
long double ld; 
short sh; 
void *pv; 


assert(sprintf(buf, "%2c|%-4d|%.40|%41X", 


‘a', -4, 8, 12D) == 16); 
assert(stremp(buf, " a|-4 |0010|OXC") == 0); 
assert(sscanf (buf, " %c| % hd | $i [$1 x", 

&ch, &sh, &in, &lo) -- 4); 
assert(ch == 'a' && sh == -4 && in == 8 && lo == 12); 


assert (sprintf (buf, "%E|%.2f|%Lg", 
1.1e20, -3.346, .02L) == 23); 
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图 12-61 
GE 


assert (strcmp (buf, "1.100000E«20|-3.35|0.02") == 0); 
assert(sscanf(buf, "%e|%lg|%Lf", &fl, &db, &ld) == 3); 
assert(fabs(fl - 1.1e20) / 1.1e20 < 4 * FLT EPSILON); 
assert(fabs(db + 3.35) / 3.35 < 4 * DBL EPSILON) ; 
assert(fabs(1d - 0.02) / 0.02 < 4 * LDBL EPSILON); 
assert (4 <= sprintf(buf, "|%%%n $p", 
&in, (void *)&ch) && in == 2); 

assert (sscanf (buf, "|$$9n %p", &in, &pv) == 1 && in == 2); 

{ /* test formatted I/O */ 
char buf[10]; 
const char *tn = tmpnam(NULL); 
FILE *pf; 
fpos t fpi, fp2; 
int inl, in2; 
long off; 


assert(tn != NULL && (pf = fopen(tn, "w+")) != NULL); 
setbuf (pf, NULL); 
assert (fprintf (pf, "123\n") == 4); 
assert((off - ftell(pf)) !- -1); 
assert(fprintf(pf, "456\n") == 4); 
assert(fgetpos(pf, &fpl) == 0); 
assert(fprintf(pf, "789\n") == 4); 
rewind (pf); 
assert (fscanf (pf, "$i", &inl) == 1 && inl == 123); 
assert (fsetpos(pf, &fpl) == 0); 
assert (fscanf (pf, "$i", &inl) == 1 && inl == 789); 
assert (fseek (pf, off, SEEK SET) == 0); 
assert(fscanf(pf, "$i", &inl) == 1 Së inl == 456); 
assert (fclose(pf) == 0 
&& freopen(tn, "r", stdin) == stdin); 

assert (setvbuf (stdin, buf, _IOLBF, sizeof (buf)) == 0); 
assert(scanf("%i", &inl) == 1 && inl == 123); 
assert (fclose(stdin) == 0); 
assert ( (pf = fopen(tn, "w+b")) != NULL); 

} 


printf ("BUFSIZ = $uMn", BUFSIZ) ; 
printf("L tmpnam = %u\n", L tmpnam); 
printf("FILENAME MAX = $uMn", FILENAME MAX); 
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图 12-62 /* test stdio functions, part 2 */ 
tstdio2.c finclude <assert.h> 
#include «errno.h» 
#include <stdio.h> 
#include <string.h> 


int main() 
{ /* test basic workings of stdio functions */ 
char buf[32], tname[L_tmpnam], *tn; 
FILE *pf; 
static int macs[] = { 


_IOFBF, , IOLBF, _IONBF, BUFSIZ, EOF, FILENAME MAX, 
FOPEN_MAX, TMP_MAX, SEEK_CUR, SEEK_END, SEEK_SET}; 


assert (256 <= BUFSIZ && EOF < 0); 
assert(8 <= FOPEN_MAX && 25 <= TMP_MAX); 


assert (tmpnam(tname) == tname && strlen(tname) < L tmpnam); 
assert ((tn = tmpnam(NULL)) ! = NULL 

&& stremp(tn, tname) !- 0); 
pf = fopen(tname, "w"); 
assert (pf !- NULL 

&& pf != stdin && pf != stdout && pf != stderr); 
assert(feof (pf) == 0 && ferror(pf) == 0); 
assert(fgetc(pf) == EOF 

&& feof(pf) == 0 && ferror(pf) !- 0); 
clearerr (pf); 
assert (ferror (pf) == 0); 
assert(fputc('a', pf) == 'a' && putc('b', pf) == 'b'); 


assert(0 <= fputs("cde\n", pf)); 
assert(0 <= fputs("fghij\n", pf)); 


assert (fflush(pf) == 0); 
assert (fwrite("klmnopgq\n", 2, 4, pf) == 4); 
assert(fclose(pf) == 0); 
assert (freopen(tname, "r", stdin) == stdin); 
assert (fgetc(stdin) == 'a' && getc (stdin) == 'b'); 
assert (getchar () == 'c'); 
assert (fgets (buf, sizeof (buf), stdin) == buf 
&& stremp(buf, "de\n") == 0); 
assert (ungetc('x', stdin) == 'x'); 
assert (gets (buf) == buf && strcmp(buf, "xfghij") == 0); 


assert (fread(buf, 2, 4, stdin) == 


&& strncmp(buf, "klmnopq\n", 8, ) == 0); 
assert (getchar () == EOF && feof(stdin) != 0); 
remove (tn); 
assert (rename (tname, tn) == 0 

&& fopen(tname, "r") == NULL); 
assert((pf = fopen (tn, "r")) !- NULL && fclose(pf) == 0); 
assert(remove(tn) == 0 && fopen(tn, "r") == NULL); 
assert((pf = tmpfile()) != NULL && fputc('x', pf) == 'x'); 


errno - EDOM; 

perror("Domain error reported as"); . 
putchar('S'), puts("UCCESS testing «stdio.h», part 2*); 
return(0); 


) 


13.1 


<stdlib.h> 


头 文件 <stdlib.h> 是 一 个 大 杂烩 ，X3J11 委员 会 发 明 这 个 头 文件 是 为 
了 定义 和 上 直 明 那些 没有 明显 的 归属 的 宏和 请 数 。 


口 


很 多 存在 的 函数 ， 例 如 abs 和 malloc， 传 统 的 头 文件 没有 声明 它们 。 
X3J11 强烈 认为 每 个 函数 都 应 该 在 一 个 标准 头 文件 声明 。 如 果 所 有 其 他 
的 头 文件 都 没有 声明 这 样 - TER ASA <stdlib.h> 就 会 声明 它 。 
新 的 宏和 函数 组 可 以 放 在 新 的 标准 头 文件 中 ，<float.h> 和 
«locale.h» 就 是 明显 的 例子 。 对 已 经 存在 的 分 组 的 补充 放 在 已 经 存 
KALEH, Bilan <string.h> 中 声明 的 strcoll 和 <time.h> 中 
启明 的 strftime。 还 有 其 他 - : 些 宏和 函数 难于 分 类 ， 那 么 它们 就 在 
«stdlib.h» 中 定义 或 者 声明 。 


这 个 头 文件 不 仅仅 是 - -个 大 杂烩 。11.1 节 中 讨论 了 头 文件 <stådet.h> 的 演 


化 。 


函数 分 组 为 了 使 这 一 章 结构 更 合理 ， 我 把 这 些 函 数 分 为 6 组 ; 


口 
口 


口 


口 


D 


口 


sr (abs, div, labs 和 ldiv) 一 一 执行 简单 的 整 型 算术 ; 
算法 (bsearch、qsort、rand 和 srand) 一 一 收集 那些 复杂 而 又 被 
上 泛 使 用 的 、 是 以 打包 作为 库 消 数 的 操作 ; 

文本 转换 (atof, atoi, atol, strtod, strtol 和 strtoul) 一 一 
lf t MATET AGA AE: 

多 字 节 转换 (mblen, mbstowcs, mbtowc, wcstombs 和 wctomb) 一 一 
多 字 节 和 宽 字 节 字 符 编码 之 间 的 转换 ; 

存储 分 配 (calloc、free、malloc 和 realloc) 
ff] HE 

ATS HEL] (abort, atexit, exit, getenv 和 system) 


执行 环境 之 间 的 接口 。 


管理 数据 对 象 


程序 和 


对 每 -组 我 都 单独 地 讨论 怎样 实现 其 中 的 函数 。 
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<stdlib.h> 


13.2 C 标准 的 内 容 


<stdlib.h> | 7.10 一 般 功能 <stdlib.h> 


size t wchar t 


atof 


atoi 


头 文件 <stdlib.h> 声明 了 4 种 类 型 和 几 个 具有 一 般 功 能 的 函数 ， 还 定义 了 几 个 宏 '*。 
声明 的 类 型 有 size_t 和 wchar_t (都 在 7.1.6 中 描述 )， 


div t 


它 是 一 个 结构 类 型 ， 也 是 函数 aiv 的 返回 值 的 类 型 ， 
ldiv 七 
也 是 一 个 结构 类 型 ， 是 函数 laiv 的 返回 值 类 型 。 
ÆR HÆR NULL (7.1.6 中 描述 )， 
EXIT FAILURE 
和 
EXIT SUCCESS 
它们 展开 为 整数 表达 式 ， 可 以 作为 exit 函数 的 参数 使 用 ， 分 别 返回 给 宿主 环境 不 成 
功 和 成 功 终止 的 状态 。 
RAND MAX 
它 展开 为 整 值 常量 表达 式 ， 其 值 是 rand 函数 返回 的 最 大 值 。 
MB CUR MAX 
它 展开 为 正 整数 表达 式 ， 其 值 是 当前 区 域 设 置 (类 型 LC CTvPE) 指定 的 扩展 字符 集中 
多 字 节 字符 的 最 大 字 节 数目 ， 并 朋 绝 不 会 比 wp LEN MAX X. 
7.10.1 字符 转换 函数 
函数 atof, atoi 和 atol 不 会 影响 错误 的 整数 表达 式 ermo 的 值 。 如 果 结 果 的 值 不 能 
表示 ， 则 行为 是 未 定义 的 。 
7.10.1.1 函数 atof 
概述 


#include <stdlib.h> 
double atof{const char *nptr); 


说 明 
函数 atof 把 nprt 指向 的 字符 串 的 初始 部 分 转换 为 double 类 型 的 表示 。 除 了 出 错 后 
的 行为 ， 它 等 价 于 : 
strtod{nptr, (char **)NULL) 
返回 值 
函数 atof 返回 转换 后 的 值 。 
参见 : 函数 strtod (7.10.1.4)。 
7.10.1.2 BA atoi 
概述 
#include <stdlib.h> 
int atoi(const char *nptr); 


说 明 
函数 atoi 把 nprt 指向 的 字符 串 的 初始 部 分 转换 为 int 表示 。 除 了 出 错 后 的 行为 ， 它 


等 价 于 : 
(int)strtol(nptr, (char **)NULL,10) 
返回 值 
函数 atoi 返回 转换 后 的 值 。 
BR: PR strtol (7.10.1.5). 
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atol | 7.10.1.3 函数 atol 


strtod 


strtol 


概述 


#include <stdlib.h> 
long int atol(const char *nptr); 


说 明 
函数 atol 把 nprt 指向 的 字符 串 的 初始 部 分 转换 为 Iong int 表示 。 除 了 出 错 后 的 行 
为 ， 它 等 价 于 : 
strtol (nptr, (char **)NULL,10) 
XR EM 
函数 atol 返回 转换 后 的 值 。 
SN: 函数 strtol (7.10.1.5). 


7.10.1.4 函数 stztod 
概述 


#include <stdlib.h> 
double strtod(const char *nptr,char **endptr); 

说 明 

函数 strtod 把 nptz 指向 的 串 的 初始 部 分 转换 为 double 表示 。 首 先 ， 它 把 输入 串 分 
解 为 3 个 部 分 ， 可 能 为 空 的 初始 序列 ， 由 一 些 空白 字符 《由 isspace 函数 指定 ) 组成; A 
标 序列 浮 点 常量 相似 的 序列 ， 最 后 一 个 序列 由 一 个 或 者 多 个 不 能 识别 的 字符 组 成 ， 包 括 输 
人 串 的 结束 的 空 字符 。 然 后 ， 它 试 着 把 目标 序列 转换 为 一 个 浮 点 数 并 返回 结果 。 

目标 序列 的 期 望 形式 是 一 个 可 选 的 加 号 或 者 减 号 ,然后 是 非 空 的 数字 序列 ， 其 中 可 能 
包括 小 数 点 ， 接 着 是 可 选 的 指数 部 分 ， 如 6.1.3.1 中 所 定义 的 ， 但 没有 浮 点 后 缀 。 目 标 序 列 
定义 为 输入 串 的 最 长 的 初始 序列 ， 以 第 一 个 非 空白 字符 开头 ， 这 也 是 期 望 的 形式 。 如 果 输 
入 串 为 空 或 者 完全 由 空白 组 成 ， 或 者 第 一 个 非 空白 字符 不 是 符号 、 数 字 或 者 小 数 点 字符 ， 
则 目标 序列 不 包含 任何 字符 。 

如 果 目 标 序 列 是 期 望 的 形式 ， 字 符 序 列 以 一 个 数字 或 者 小 数 点 字符 开头 《不 论 哪 一 个 
在 前 )， 它 就 会 根据 6.1.3.1 的 规则 被 解释 为 一 个 浮 点 常量 ， 除 非 小 数 点 是 用 来 代替 句号 ， 
或 者 假定 小 数 点 紧 跟 着 串 的 最 后 一 个 数字 ( 如 果 既 没有 指数 部 分 也 没有 小 数 点 字符 出 现 ) 
如 果 中 间 序 列 以 一 个 减 号 开头 ， 则 转换 后 的 值 就 变 为 它 的 相反 数 。 如 果 endptr 不 为 空 ， 
则 指向 最 后 串 的 指针 存储 在 endptr 指向 的 对 象 中 。 

dE "C" 区 域 设置 之 外 ， 实 现 定义 的 其 他 目标 序列 形式 也 能 被 接受 。 

如 果 目 标 序 列 为 空 或 者 不 是 期 望 的 形式 ， 则 不 执行 任何 转换 。 如 果 endptr 不 为 空 ， 
则 nptr 的 值 就 存储 在 endptr 指向 的 数据 对 象 中 。 

返回 值 

如 果 存 在 转换 后 的 值 ， 函 数 strtod 就 返回 这 个 值 。 如 果 没 有 执行 转换 ， 则 返回 零 。 
如 果 正 确 的 转换 值 在 可 表示 值 的 范围 外 ， 则 返回 正 或 者 负 ( 根据 值 的 符号 ) 的 HUGE, VAL, 
并 将 宏 ERANGE 的 值 存 储 在 errno 中 。 如 果 正 确 的 转换 值 会 造成 下 溢 ， 则 返回 零 ， 并 将 宏 
ERANGE 的 值 存储 在 errno 中 。 
7.10.1.5 函数 strtol 


概述 
#include <stdlib.h> 
long int strtol(const char *nptr,char **endptr,int base); 
说 明 
RÉI strtol 把 nptr 指向 的 串 的 初始 部 分 转换 为 long int 表示 。 首 先 ， 它 把 输入 串 分 
解 为 3 个 部 分 : 可 能 为 空 的 初始 序列 ， 由 空白 字符 《由 isspace 函数 指定 》 组 成 ， 目标 序列 
是 一 个 和 基数 为 base 的 整数 表示 相似 的 序列 ， 最 后 一 个 序列 由 一 个 或 者 多 个 不 能 识别 的 字 
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strtoul 


| 符 组 成 ， 包 括 输入 串 的 结 洁 束 的 空 字符 。 然 后 ， 它 试 着 把 目标 序列 转换 为 一 个 整数 并 返回 结果 。 


如 果 base 的 值 为 零 ， 目 标 序列 的 期 望 形式 就 是 6.1.3.2 描述 的 整数 常量 ， 前 面 可 以 有 
一 个 加 号 或 者 减 号 ， 但 不 包括 整数 后 级 。 如 果 base 的 值 在 2 到 36 之 间 ， 那 么 目标 序列 的 
期 望 形式 就 是 字母 和 数字 的 序列 ， 它 表示 以 base 为 基数 的 整数 ， 前 面 可 以 有 一 个 加 号 或 


.者 减 号 ,但 不 包括 整数 后 强 。 字 母 a (或 者 A) Ble 或 者 2) 分 别 代表 值 10 到 35， 只 人 允 
| 许 使 用 代表 的 值 小 于 base 的 那些 字母 。 如 果 base 的 值 是 16， 字 符 Ox zX Ox AT LU 
| 在 含有 字母 和 数字 的 序列 之 前 ， 如 果 有 符号 的 话 ， 就 紧 跟 符号 。 


目标 序列 被 定义 为 输入 串 的 最 长 的 初始 序列 ， 以 第 一 个 非 空白 字符 处 开始 ， 这 就 是 期 


| 望 的 形式 。 如 果 输 入 串 为 空 或 者 完全 由 空白 组 成 ， 或 者 第 一 个 非 空白 字符 不 是 符号 或 允许 


使 用 的 字母 或 数字 ， 那 么 中 间 序 列 不 包含 任何 字符 。 
如 果 目 标 序列 是 期 望 的 形式 ， 而 且 base 的 值 为 零 ， 以 第 一 个 数字 开头 的 字符 序列 就 


| 会 根据 6.1.3.2 的 规则 被 解释 为 一 个 整数 常量 。 如 果 目 标 序 列 是 期 望 的 形式 ， 而 且 base 的 

| 值 在 2 和 36 之 间 ， 它 就 被 用 作 转 换 的 基数 ， 和 和 它 对 应 的 每 一 个 字母 如 上 所 示 。 如 果 目 标 

| 序列 以 一 个 减 号 开头 ， 转 换 后 的 值 就 变 为 它 的 相反 数 。 如 果 endptr 不 是 一 个 空 指针 ， 那 
么 指向 最 后 串 的 指针 就 存储 在 enGptr 指向 的 数据 对 象 中 。 


在 "c" 区 域 设 置 之 外 ， 实 现 定义 的 其 他 的 中 间 序 列 形式 也 能 被 接受 。 
如 果 上 生 标 序列 为 空 或 者 不 是 期 望 的 形式 ， 则 不 执行 任何 转换 。 如 果 endptr FAB, 


| 则 nptr 的 值 就 存储 在 endptr 指向 的 对 象 中 。 


返回 值 

如 果 存 在 转换 后 的 值 ， 函 数 strtol 就 返回 这 个 值 。 如 果 没 有 执行 转换 ， 则 返回 
零 。 如 果 正 确 的 转换 值 在 可 表示 值 的 范围 外 ， 则 根据 值 的 符号 ) 返回 LONG. MAX 或 者 
LONG_MIN， 并 把 宏 ERANGE 存储 在 errno H, 


| 7.10.1.6 函数 strtoul 


概述 
#include <stdlib.h> 
unsigned long int strtoul (const char *nptr,char **endptr,int base); 
说 明 
函数 strtoul 把 nptr 指向 的 串 的 初始 部 分 转换 为 unsigned long int 表示 。 首 先 ， 
它 把 输入 串 分 解 为 3 个 部 分 : 可 能 为 空 的 初始 序列 ， 由 空白 字符 〈 由 isspace 函数 指定 》 


| 组成， 目标 序 列 是 一 个 和 基数 为 base 的 无 符号 整数 表示 相似 的 序列 ， 最 后 一 个 序列 由 一 


个 或 者 多 个 不 能 识别 的 字符 组 成 ， 包 括 输入 串 的 结束 的 空 字符 。 然 后 ， 它 试 着 把 目标 序列 
转换 为 一 个 无 符号 整数 并 返回 结果 。 

如 果 base 的 值 为 零 ， 目 标 序列 的 期 望 形式 就 是 6.1.3.2 描述 的 整数 常量 ， 前 面 可 以 有 
一 个 加 号 或 者 减 号 ， 但 不 包括 整数 后 经。 如 果 base 的 值 在 2 到 36 之 间 ， 那 么 目标 序列 的 
期 望 形式 就 是 字母 和 数字 的 序列 ， 它 表示 以 base 为 基数 的 整数 ， 前 面 可 以 有 一 个 加 号 或 


| 者 减 号 ， 但 不 包括 整数 后 级 。 字 母 a (或 者 A) 到 z (或 者 z) 分 别 代表 值 10 到 35， 只 允 


许 使 用 代表 的 值 小 于 base 的 那些 字母 。 如 果 base 的 值 是 16， 字 符 Ox 或 者 OX d AT DUE 
在 字母 和 数字 的 序列 之 前 ， 如 果 有 符号 的 话 ， 就 紧 跟 符号 。 
目标 序列 被 定义 为 输入 串 的 最 长 的 初始 序列 ， 以 第 一 个 非 空白 字符 处 开始 ， 这 就 是 期 


| 望 的 形式 。 如 果 输 入 串 为 空 或 者 完全 由 空白 组 成 ， 或 者 第 一 个 非 空白 字符 不 是 符号 或 允许 
使 用 的 字母 或 数字 ， 那 么 目标 序列 不 包含 任何 字符 。 


如 果 目 标 序列 是 期 望 的 形式 ， 而 且 base 的 值 为 零 ， 以 第 一 个 数字 开头 的 字符 序列 就 
会 根据 6.1.3.2 的 规则 被 解释 为 一 个 整数 常量 。 如 果 目 标 序 列 是 期 望 的 形式 ， 而 且 base 的 


| 值 在 2 和 36 之 间 ， 它 就 是 转换 的 基数 ， 和 它 对 应 的 每 一 个 字母 如 上 所 示 。 如 果 目 标 序 列 
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rand 


srand 


以 一 个 减 导 开头 ， 转 换 后 的 值 就 变 为 它 的 相反 数 。 如 果 endptr 不 是 一 个 空 指针 ， 那么 指 
向 最 后 串 的 指针 就 存储 在 endptr 指向 的 数据 对 象 中 。 

在 "Cc" 区 域 设置 之 外 ， 实 现 定义 的 其 他 的 中 间 序 列 形式 也 能 被 接受 。 

如 果 目 标 序列 为 空 或 者 不 是 期 望 的 形式 ， 则 不 执行 任何 转换 。 如 果 endptr 不 为 空 ， 
则 nptr 的 值 就 存储 在 endptr 指向 的 对 象 中 。 

返回 值 

如 果 存 在 转换 后 的 值 ， 函 数 strtoul 就 返回 这 个 值 。 如 果 没 有 执行 转换 ， 则 返回 零 。 如 
有 果 正 确 的 转换 值 在 可 表示 值 的 范围 外 ， 则 返回 ULONG_MAX， 并 把 宏 ERANGE 存储 在 errno 中 。 
7.10.2 伪 随 机 序列 产生 函数 
7.10.2.1 函数 rand 


概述 
#include <stdlib.h> 
int rand(void); 


说 明 
函数 rand 计算 一 个 伪 随 机 整数 序列 ， 它 们 的 范 膨 在 0 到 RAND MAX 之 问 。 
实现 的 行为 不 受 rand 函数 的 影响 。 
返回 值 
PRAE rand 返回 一 个 伪 随 机 整数 。 
环境 限制 
宏 RAND MAX 的 值 至 少 应 该 为 32 767。 
7.10.2.2 函数 srand 
概述 


#include <stdlib.h> 
void srand(unsigned int seed); 


说 明 

eR RL srand 使 用 参数 作为 一 个 新 的 伪 随 机 数 序列 的 种 子 ， 这 个 序列 由 后 来 对 rana 
的 调用 返回 。 如 果 再 用 相同 的 种 子 调 用 sranda， 那 么 伪 随 机 数 序列 就 会 重复 。 如 果 在 对 
srand 的 任何 调用 之 前 调用 *anda， 那 么 它 产生 的 序列 和 用 1 为 参数 第 一 次 调用 srand 之 后 
生成 的 序列 相同 。 

实现 的 行为 不 受 srana 函数 调用 的 影响 。 

返回 值 

PRÉ srand 没有 返回 值 。 

例子 

下 面 的 函数 定义 了 rand 和 srand 的 一 个 可 移植 的 实现 。 


static unsigned long int next = 1; 


int rand(void) /* RAND MAX assumed to be 32767 */ 
{ 

next = next * 1103515245 + 12345; 

return (unsigned int) (next/65536) % 32768; 
H 


void srand(unsigned int seed) 


next - seed; 
) 
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calloc 


free 


malloc 


realloc 


7.10.3 内 存 管理 函数 

通过 连续 调用 函数 calloc. malloc 和 realloc 所 分 配 的 空间 的 顺序 和 连续 性 是 不 确 
定 的 。 如 果 分 配 成 功 ， 那 么 返回 的 指针 就 能 被 适当 赋值 为 指向 任意 类 型 的 对 象 的 指针 ， 然 
后 就 可 以 用 它 来 访问 存储 在 所 分 配 的 空间 中 的 这 种 数据 对 象 或 者 这 种 数据 对 象 的 数组 〈 直 
到 空间 被 显 式 地 释放 或 者 重新 分 配 )。 每 一 次 分 配 都 应 该 产生 一 个 不 和 其 他 对 象 相 连 的 指 
针 ， 返 回 的 指针 指向 分 配 空 间 的 开始 位 置 〈 最 低 字 节 地 址 )。 如 果 不 能 分 配 空 间 ， 就 返回 
空 指针 。 如 果 要 求 分 配 的 空间 大 小 是 零 ， 那 么 行为 是 由 实现 定义 的 ， 返 回 的 值 是 一 个 空 指 
针 或 者 一 个 特殊 的 指针 。 空 间 释 放 后 指针 的 值 是 不 确定 的 。 
7.10.3.1 函数 calloc 

概述 


#include <stdlib.h> 
void *calloc(size t nmemb, size t size); 
说 明 
函数 calloc 为 memb 个 对 象 的 数组 分 配 空间 ， 每 一 个 元 素 的 大 小 为 size， 分 配 空间 
的 所 有 位 都 被 初始 化 为 零 ”。 
返回 值 
函数 cal Loc 返回 一 个 空 指针 或 者 指向 分 配 的 空间 的 指针 。 
7.10.3.2 B& free 
概述 
#include <stdlib.h> 
void free(void *ptr); 


说 明 

函数 free 释放 ptr 指向 的 空间 ， 也 就 是 说 这 部 分 空间 以 后 还 可 以 被 分 配 。 如 果 ptr 是 
一 个 空 指针 ， 则 不 发 生 任何 行为 。 否 则 ， 如 果 参 数 与 calloc. malloc 或 者 realloc 之 前 返 
回 的 指针 不 匹配 ， 或 者 它 指向 的 空间 已 经 被 free 和 realloc 释放 了 ， 那 么 行为 是 未 定义 的 。 

返回 值 

函数 free 没有 返回 值 。 
7.10.3.3 函数 malloc 


概述 
include <stdlib.h> 
void *malloc(size t size); 
说 明 
函数 malloc 为 一 个 对 象 分 配 空 间 , 其 中 , 该 对 象 的 大 小 由 size 指定 且 对 象 的 值 是 不 
确定 的 。 
返回 值 
函数 malloc 返回 一 个 空 指针 或 者 指向 分 配 空间 的 指针 。 
7.10.3.4 函数 realloc 
概述 


#include <stdlib.h> 
void *realloc(void *ptr, size_t size); 


说 明 

Fs realloc 将 ptr 指向 的 对 象 的 大 小 改变 为 由 size 指定 的 大 小 。 新 旧 空 间 中 较 小 的 
一 个 中 的 对 象 内 容 应 该 保持 不 变 。 如 果 新 空间 比较 大 ， 那 么 对 象 的 新 分 配 部 分 的 值 是 不 确定 
的 。 如 果 ptr 是 一 个 空 指针 ， 那 么 对 于 一 个 指定 的 大 小 函数 realloc AFT ARR malloc 相 
F: GA WR ptr 5 calloc, malloc 或 者 realloc 之 前 返回 的 指针 不 匹配 ， 或 者 它 指 
向 的 空间 已 经 被 free 或 者 realloc 释放 了 ， 那 么 行为 是 未 定义 的 。 如 果 不 能 分 配 空间 ， 则 
ptr 指向 的 对 象 不 变 。 如 果 size ZEA ptr 不 是 空 指针 ， 那 么 它 指向 的 对 象 就 会 被 释放 。 
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返回 值 
函数 realloc 返回 空 指针 或 者 指向 可 能 被 移动 了 的 分 配 空间 的 指针 。 
7.10.4 环境 通信 函数 
abort | 7.10.4.1 函数 abort 
概述 


#include <stdlib.h> 
void abort (void); 


说 明 

函数 abort 使 程序 异常 终止 ， 除 非 捕获 了 信号 SIGABRT 且 信 号 处 理 程序 没有 返回 。 是 
清空 打开 的 输出 流 ， 还 是 关闭 打开 的 流 还 是 移 除 临 时 文件 是 由 实现 定义 的 。 一 种 由 实现 定 
义 的 不 成 功 的 终止 状态 会 通过 函数 调用 raise (SIGABRT) 返回 给 宿主 环境 。 

返回 值 

函数 abort 不 能 返回 到 它 的 调用 者 。 

atexit | 7.10.4.2 函数 atexit 
概述 


#include <stdlib.h> 
int atexit (void (*func) (void) ); 
说 明 
函数 atexit 注册 func 指向 的 函数 ， 该 函数 在 程序 正常 终止 的 时 候 被 调用 ， 而 不 需要 
任何 参数 。 
实现 限制 
实现 应 该 支持 至 少 32 个 函数 的 注册 。 
返回 值 
如 果 注 册 成 功 ， 函 数 atexit 返回 零 ， 否 则 返回 非 零 。 
参见 : 函数 edt (7.10.43). 
exit | 7.10.4.3 函数 exit 
概述 


#include <stdlib.h> 
void exit (int status); 
说 明 
函数 exit 使 程序 的 执行 正常 终止 。 如 果 程 序 执行 了 对 exit 的 多 次 调用 ， 则 这 种 行为 
未 定义 。 
首先 ， 调 用 所 有 atexit 注册 的 函数 ， 按 照 它们 注册 时 的 反 顺 序 调用 7. 
然后 ， 清 空 所 有 打开 的 具有 未 写 缓冲 数据 的 流 ， 关 闭 所 有 打开 的 流 ， 并 删除 tmpfile 
函数 创建 的 所 有 文件 。 
最 后 ， 控 制 权 返回 给 宿主 环境 。 如 果 status 的 值 是 零 或 者 EXIT_sUcCESS， 则 返回 一 
种 由 实现 定义 的 成 功 终止 状态 。 如 果 status 的 值 是 EXIT_FAILURE， 则 返回 一 种 由 实现 
定义 的 不 成 功 终止 状态 。 否则 ， 返 回 的 状态 是 由 实现 定义 的 。 
返回 值 
函数 exit 不 能 返回 到 它 的 调用 者 。 
getenv | 7.10.4.4 函数 getenv 
概述 


#include <stdlib.h> 
char *getenv(const char *name); 
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system 


bsearch 


qsort 


说 明 
函数 getenv 搜索 宿主 环境 提供 的 环境 表 ， 来 查找 一 个 能 和 name 指向 的 串 匹 配 的 串 。 


| 环境 名 字 集 和 修改 环境 表 的 方法 是 由 实现 定义 的 。 


实现 的 行为 不 受 getenv RAAEN. 
返回 值 
函数 getenv 返回 一 个 指向 审 的 指针 ， 这 个 串 与 匹配 的 列表 成 员 相关 。 指 向 的 串 不 能 


| 被 程序 修改 ， 但 是 可 以 通过 后 续 调用 函数 getenv 被 覆盖 。 如 果 不 能 找到 指定 的 name， 则 


返回 空 指针 。 
7.10.4.5 函数 system 


finclude «stdlib.h» 
int system(const char *string); 
说 明 


函数 system 把 string 指向 的 串 传递 给 宿主 环境 ， 然 后 命令 处 理 程序 按照 实现 定义 


,的 方式 执行 它 。 可 以 使 用 空 指针 作为 参数 查询 命令 处 理 程序 是 否 存在 。 


返回 值 
如 果 人 参数 是 一 个 空 指针 ， 那 么 只 有 当 命令 处 理 程序 可 用 的 时 候 丙 数 system i IL 4E E, 
如 果 参 数 不 是 空 指针 ， 函 数 system 返 回 一 个 实现 定义 的 值 。 


7.10.5 查找 和 排序 函数 
7.10.5.1 HA bsearch 
概述 
*include <stdlib.h> 
void *bsearch(const void *key, const void *base, size t nmemb, 
size t size, int (*compar) (const void *, const void *)); 
说 明 


PR Å bsearch 搜索 一 个 nmemb 个 对 象 的 数组 ， 来 查找 与 key 指向 的 对 象 匹配 的 元 素 ， 


| base 指向 这 个 数组 的 第 一 个 元 素 。 数 组 中 每 一 个 元 素 的 大 小 由 size 指定 。 


用 两 个 参数 调用 compar 指向 的 比较 函数 ， 第 1 个 参数 指向 key 数据 对 象 第 2 个 参数 


| 指向 一 个 数组 元 素 。 如 果 key 对 象 小 于 、 等 于 或 者 大 于 数组 元 素 ， 则 函数 将 分 别 返 回 一 个 
| 小 于 零 、 宁 于 零 或 者 大 于 零 的 整数 。 此 时 ， 数 组 的 前 一 部 分 存储 的 应 该 是 小 于 key 的 元 


素 ， 中 间 一 部 分 是 等 于 key 的 元 素 ， 而 最 后 -部 分 是 大 于 key DE, 
返回 值 
PARK bsearch 返回 指向 数组 中 与 key 匹配 的 元 素 的 指针 ， 如 果 找 不 到 这 样 的 元 素 ， 则 


返 同 空 指针 。 如 果 两 个 元 素 比 较 时 相等 ， 则 未 指定 和 哪个 元 素 匹 配 。 
7.10.5.2 函数 asort 


概述 
#include <stdlib.h> 
void qsort (void *base, size t nmemb, size t size, 
int (*compar) (const void *, const void *)); 
说 明 


SÉ asort 对 一 个 包含 nmemb 个 对 象 的 数组 进行 排序 ， 其 第 -- 个 元 素 由 base 指向 ， 


| 数组 中 每 个 元 素 的 大 小 是 由 size 指定 。 


根据 compar 所 指向 的 比较 函数 将 数组 内 容 排 列 成 升序 。 函 数 的 参数 分 别 指向 两 个 数 


组 元 素 的 指针 。 如 果 第 一 个 元 素 小 于 、 等 于 或 者 大 于 第 二 个 元 素 ， 则 函数 分 别 返 回 小 于 
| 零 、 等 于 零 和 大 于 零 的 整数 。 


如 果 比 较 的 两 个 元 素 相等 ， 则 没有 指定 它们 在 排列 后 的 数组 中 的 顺序 。 
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div 


labs 


ldiv 


返回 值 

函数 qsort 没有 返回 值 。 
7.10.6 整数 算术 函数 
7.10.6.1 函数 abs 

概述 


include <stdlib.h> 
int abs(int j); 
说 明 
函数 abs 计算 整数 j 的 绝对 值 。 如 果 结 果 不 能 表示 ， 则 这 种 行为 未 定义 “。 
返回 值 
函数 abs 返回 绝对 值 。 
7.10.6.2 函数 div 
概述 


#include <stdlib.h> 
div_t div(int numer, int denom); 
说 明 
函数 div 计算 分 子 numer 除 以 分 母 denom 所 得 的 商 和 余数 。 如 果 不 能 整除 ， 那 么 所 
得 的 商 是 小 于 它 的 代数 商 的 最 接近 的 整数 。 如 果 结 果 不 能 表示 ， 那 么 行为 未 定义 ， 否则 
numer 等 于 quot*denomtrem, 
返回 值 
函数 div 返回 一 个 div t 类 型 的 结构 ， 该 结构 由 商 和 余数 组 成 。 结 构 应 该 包含 以 下 成 
员 ， 不 分 先后 顺序 : 


int quot; /* quotient */ 
int rem; /* remainder */ 


7.10.6.3 函数 labs 
概述 


finclude <stdlib.h> 
long int labs(long int j); 


说 明 

函数 labs 和 函数 abs 很 相似 ， 只 不 过 它 的 参数 和 返回 值 的 类 型 都 是 long int. 
7.10.6.4 函数 1div 

概述 


#include <stdlib.h> 
ldiv t ldiv(long int numer, long int denom) ; 


说 明 
函数 laiv 和 函数 div 很 相似 ， 只 不 过 它 的 参数 和 返回 的 结构 (19iv_t 类 型 ) FÅR 
的 类 型 都 是 long int。 


7.10.7 多 字 节 字符 函数 


多 字 节 字符 函数 的 行为 受 当前 区 域 设 置 的 类 别 LC_CTYPE 的 影响 。 对 一 个 状态 相关 的 
编码 方式 ， 每 一 个 函数 都 通过 调用 它 的 字符 指针 参数 s， 进 入 到 这 个 函数 的 初始 状态 ，s 
是 一 个 空 指针 。s 为 非 空 指针 时 ， 使 用 s 对 函数 的 后 续 调 用 可 以 在 必要 的 时 候 改变 函数 的 
内 部 状态 。s 为 空 指针 时 ， 如 果 编 码 方式 是 状态 相关 的 ， 那 么 这 些 函 数 就 会 返回 一 个 非 零 
få: FUEL. MEX] LC. CTYPE 会 导致 这 些 函 数 的 转移 状态 变 得 不 确定 。 
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mblen | 7.10.7.1 函数 mblen 


mbtowc 


概述 
finclude <stdlib.h> 
int mblen(const char *s, size t n); 
TE BÀ 
如 果 s PÆ— Toft, BM mblen 就 确定 s 指向 的 多 字 节 字符 中 包含 的 字 节 数 。 除 
了 mbtowc 明 数 的 转移 状态 不 受 影响 ， 这 个 函数 等 价 于 : 
mbtowc( (wchar t *) o, s, n) ; 
Sc LATT AI EA EEN mblen 的 影响 。 
返回 值 
MR s 是 一 个 空 指针 ， 多 字 节 字符 编码 是 状态 相关 的 或 不 是 状态 相关 的 时 ， 函 数 
mblen 分 别 返 加 一 个 非 零 或 者 零 值 。 如 果 s 不 是 空 指针 ， 函 数 molen 或 者 返回 零 〈 如 果 s 
指向 空 字 符 )， 或 者 返回 多 字 节 字符 包含 的 字 节 数 〈 如 果 后 面 n 个 或 者 更 少 的 字 节 形成 一 
个 有 效 的 多 字 节 字符 )， 或 者 返回 -1 (如 果 它 们 不 能 形成 有 效 的 多 字 节 字符 )。 
BR: pA mbtowc (7.10.7.2)。 
7.10.7.2 函数 mbtowc 


#include <stdlib.h> 
int mbtowc(wchar t *pwc, const char *s, size t n); 


说 明 

如 果 s 不 是 一 个 空 指针 ， 范 数 mbtowc 确定 s 指向 的 多 字 节 字符 中 包含 的 字 节 数 ， 然 
后 确定 和 这 个 多 字 节 字符 对 应 的 wchar_t 类 型 的 值 的 编码 。( 和 空 字 符 对 应 的 编码 值 是 
F.) 如 果 多 字 节 字符 有 效 且 pwe 不 是 空 指针 ，mbtowc 函数 就 把 编码 存储 在 pec 指向 的 对 
象 中 。 最 多 可 以 检测 s 指向 的 数组 中 的 n 个 字 节 。 

实现 的 行为 不 受 函 数 mbtowc 调用 的 影响 。 

返回 值 

如 果 s 是 一 个 空 指针 ， 多 字 节 字符 编码 是 状态 相关 的 或 不 是 状态 相关 的 时 ， 函 数 
mbtowc 分 别 返 回 一 个 非 零 或 者 零 值 。 如 果 s 不 是 空 指针 ， 则 函数 mbtowc 或 者 返回 零 〈 如 
RK s 指向 空 字符 )， 或 者 返回 转换 的 多 字 节 字符 中 包含 的 字 节 数 〈 如 果 后 面 n 个 或 者 更 少 的 字 
节 形 成 一 个 有 效 的 多 字 节 字符 )， 或 者 返回 -1 如果 它们 不 能 形成 一 个 有 效 的 多 字 节 字符 )。 

任何 情况 下 返回 的 值 都 不 能 比 n 或 者 宏 MB, CUR. MAX 的 值 大 。 
7.10.7.3 函数 wctomb 

概述 


#include <stdlib.h> 
int wctomb(char *s, wchar t wchar); 
说 明 
函数 wctomb 确定 表示 多 字 节 字符 所 需要 的 字 节 数 ， 这 个 多 字 节 字符 和 值 为 wchar 
(包括 转移 状态 中 的 任何 改变 ) 的 编码 相对 应 。 它 把 多 字 节 字 符 表示 存储 在 s〈 如 果 s 不 
是 空 指针 ) 指向 的 数组 对 象 中 ， 最 多 可 以 存储 MB_CUR_MAX 个 字符 。 如 果 wchar 的 值 是 零 ， 
则 函数 仍 为 初始 的 转移 状态 。 
实现 的 行为 不 受 调用 函数 we combo 的 影响 。 
返回 值 
如 果 s 是 一 个 空 指针 ， 多 字 节 字符 编码 是 状态 相关 的 或 不 是 状态 相关 的 时 ， 函 数 wctomb 
分 别 返 回 一 个 非 零 或 者 零 值 。 如 果 s 不 是 空 指针 ，wchar 的 值 不 能 对 应 一 个 有 效 的 多 字 节 
FAR, KØGE 1. 否则 函数 返回 和 wchar 的 值 对 应 的 多 字 节 字符 中 包含 的 字 节 数 。 
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mbstowcs 


wcstombs 


任何 情况 下 的 返回 值 都 不 能 比 宏 MB CUR MAX 的 值 大 。 
7.10.8 SS TRAM 

ETTE PRATT AE DOR EECH 
7.10.8.1 函数 mbstowes 

概述 


#include <stdlib.h> 
size t mbstowcs(wchar t *pwcs, const char *s, size t n); 


说 明 

函数 mbstowcs 将 s 指向 的 数组 中 以 初始 的 转移 状态 开始 的 多 字 节 字符 序列 转换 为 相 
应 的 编码 序列 ， 并 将 最 多 n 个 编码 存放 到 pwes Pooh 空 字符 〈 转 换 成 值 为 零 的 
编码 ) 后 面 的 多 字 节 字符 不 会 被 检测 或 者 转换 。 每 一 个 多 字 节 字符 都 像 调用 mbtowc 一 样 
进行 转换 ， 只 不 过 函数 mbtowc RER REE Wi. 

pwes 指向 的 数组 中 最 多 只 能 修改 n 个 元 素 。 如 果 复 制 发 生 在 两 个 重要 的 对 象 之 间 ， 那 
么 行为 未 定义 。 

返回 值 

如 果 遇 到 无 效 的 多 字 节 字符 ， 函 数 mbstowcs 返回 (size_t) —1; Fil KR 
mbstowcs 返回 修改 的 数组 元 素 的 个 数 ， 不 包括 终止 的 零 编码 (如 果 有 的 话 )。 
7.10.8.2 函数 wcstombs 

概述 


#include <stdlib.h> 
size_t wcstombs(char *s, const wchar t *pwcs, size t n); 


说 阴 

函数 wcstombs 将 以 pwes 指向 的 数组 中 的 多 字 节 字符 对 应 的 编码 序列 转换 成 以 初始 的 
转移 状态 开始 的 多 字 节 字符 序列 ， 并 将 结果 存放 在 s 指向 的 字符 数组 中 。 如 果 一 个 多 字 节 
字符 超过 了 nm 个 字 节 的 限制 或 存储 了 一 个 空 字符 ， 则 存储 结束 。 每 个 编码 像 调用 wctonb 
一 样 进行 转换 ， 只 不 过 wetomb 的 转移 状态 不 受 影响 。 

å s 指向 的 数组 中 最 多 只 能 修改 n 个 字 节 。 如 果 复 制 发生 在 两 个 重 秋 的 对 象 之 间 ， 那 
么 这 种 行为 未 定义 。 

返回 值 

如 果 遇 到 一 个 不 能 和 有 效 的 多 字 节 字符 对 应 的 编码 ， 那 么 函数 wcstombs 返回 (size t)-1; 
FU, BRM wcstombs 返回 修改 的 字 节 数 ， 不 包括 终止 的 空 字符 〈 如 果 有 的 话 ) '. 

脚注 

126. 参考 “ 库 的 展望 ”(7.1 3.7)。 

127. 注意 它 不 需要 和 浮 点 零 或 者 空 指针 常量 的 表示 相同 。 

128. 每 个 函数 的 调用 次 数 与 它 的 注册 次 数 相同 

129. 实际 上 ， 整 个 数组 是 根据 比较 函数 来 排序 的 。 

130. 最 小 的 负数 的 绝对 值 不 能 用 2 的 补 码 表示 。 

131. 如 果实 现 使 用 一 些 特殊 的 字 节 来 改变 转移 状态 ， 这 些 字 节 不 会 产生 单独 的 宽 字 节 

字符 编码 ， 而 是 要 跟 临 近 的 多 字 节 字符 编 为 一 组 。 
132. 如 果 返 回 值 是 a， 那么 数组 不 会 是 以 空 或 者 零 结束 。 
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FEN Boon S 


堆 的 开销 


<stdlib.h> 中 声明 的 很 多 函数 都 可 以 单独 列 出 来 。 也 许 ，atexit 要 和 
exit 一 起 使 用 ，srand 要 和 rand 一 起 使 用 。 但 仍然 可 以 单独 地 使 用 和 理解 
大 部 分 图 数 。 在 这 么 多 函数 中 ， 有 两 组 更 为 重要 ; 


D 存储 分 本 函数 一 起 工作 来 管理 堆 ; 

O 多 字 节 函数 一 起 工作 来 使 大 字符 集合 的 不 同 表示 之 间 可 以 相互 转换 。 
这 些 组 中 的 每 一 组 函数 都 值得 讨论 。 

—^ C 标准 程序 的 数据 对 象 占 据 以 下 3 种 类 型 的 存储 空间 : 


o 程序 在 开始 执行 前 分 配 静 态 看 储 空间 并 进行 初始 化 。 如 果 没 有 指定 一 
个 数据 对 象 〈 部 分 或 者 全 部 ) 的 初始 值 ， 程 序 就 会 把 它 的 每 一 个 标量 
部 分 初始 化 为 零 。 这 样 的 数据 对 象 一 直 存 在 到 程序 结束 。 

口 程序 在 每 一 个 块 的 入 口 分 配 动态 存储 空间 。 如 果 没 有 指定 一 个 数据 对 
象 的 初始 值 ， 那 么 它 的 初始 内 容 是 不 确定 的 。 这 样 的 数据 对 象 存 在 到 
块 的 执行 终止 。 

口 只 有 当 调 用 函数 calloc、malloc 或 者 realloc 时 ， 程 序 才 分 配 可 控 
的 〈allocated) 存储 空间 。 只 有 调用 calloc 时 ， 它 才 会 把 这 样 的 一 个 
数据 对 象 初始 化 为 一 个 零 字 符 串 的 数组 。 这 样 的 一 个 数据 对 象 一 直 存 
在 到 用 它 的 地 址 作为 参数 调用 free 函数 ， 或 者 直到 程序 结束 。 


那些 对 可 分 配 的 空间 进行 操作 的 函数 就 是 <stdlib.h> 中 声明 的 存储 分 
配 函 数 。 


静态 存储 空间 存在 于 程序 的 整个 执行 过 程 中 。 动 态 存 储 空间 遵循 后 进 先 
出 的 原则 ， 它 可 以 用 一 个 栈 实现 。 动 态 存储 空间 经 常 与 函数 调用 和 返回 信息 
一 起 共享 调用 栈 。( 参 考 8.1 节 开 始 的 讨论 。) 可 控 的 存储 空间 不 遵守 这 样 规 
范 的 原则 。 程 序 可 以 按照 任意 顺序 对 这 样 的 数据 对 象 混合 进行 分 配 和 释放 。 
因此 ，C 标准 库 必须 维持 一 个 独立 的 称 作 堆 的 空间 池 来 满足 控制 存储 空间 的 
要 求 。 


在 一 些 实现 中 ， 调 用 栈 和 堆 要 竞争 有 限 的 存储 空间 。 使 用 malloc 分 配 
足够 多 的 空间 就 可 能 限制 程序 以 后 调用 函数 的 深度 ， 或 者 可 能 会 很 容易 用 完 
堆 中 的 空间 。 在 任何 情况 下 ， 只 分 配 需要 的 空间 并 且 在 用 过 之 后 尽快 释放 它 
是 很 好 的 习惯 。 


注意 ， 可 控 的 存储 空间 必然 会 涉及 开销 问题 。 每 一 个 分 配 的 数据 对 象 都 
要 有 足够 多 的 信息 让 free 来 确定 将 要 释放 的 区 域 的 大 小 。 分 配 1000 个 单字 
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符 的 数据 可 能 很 容易 消耗 4 到 8 倍 的 堆 空间 。 堆 也 容易 受到 碎片 的 影响 。 在 
扒 上 按照 任意 顺序 分 配 和 释放 数据 对 象 会 不 可 避免 地 在 某 些 分 配 的 数据 对 象 
之 间 留 出 一 些 不 可 使 用 的 小 空间 。 这 样 就 大 大 减少 了 堆 的 可 用 大 小 。 

不 要 太 在 意 这 些 东西 。 把 相关 的 数据 构建 到 一 个 结构 中 并 一 次 分 配 所 有 
的 空间 ， 这 样 肯定 会 使 堆 的 开销 减 到 最 小 ， 而 且 这 也 是 一 种 好 的 编程 风格 。 
不 要 只 为 了 节省 堆 开 销 而 把 不 相关 的 数据 聚集 在 一 起 。 类 似 地 ， 为 那些 具有 
相近 的 生存 期 的 数据 对 象 同 时 分 配 空间 ， 然 后 几乎 同时 释放 它们 。 这 样 就 会 
使 堆 的 破碎 程度 最 小 化 ， 而 且 它 也 是 良好 的 编程 风格 。 不 要 为 了 减 小 堆 破碎 
程度 而 提前 或 者 推迟 不 相关 的 堆 操作 。 存 储 分 配 函 数 对 编程 的 灵活 性 有 很 大 
的 帮助 ， 要 按照 它们 期 望 的 方式 去 使 用 它们 。 

另外 一 组 相关 函数 可 以 操作 大 字符 集 。 面 对 日 文中 的 汉字 和 其 他 大 字符 
集 在 计算 机 类 产品 中 的 使 用 的 快速 增长 ， 标 准 C 添 加 了 这 组 函数 。 这 些 函 数 
用 两 种 方法 表示 这 些 字 符 集 。 


O 多 字 节 字符 是 一 个 或 者 多 个 编码 的 序列 ， 在 这 里 每 一 编码 都 可 以 
用 C 字 符 数据 类 型 来 表示 。( 字 符 数 据 类 型 有 char, signed char 和 
unsigned cpar。 在 一 个 给 定 的 实现 中 ， 它 们 具有 相同 的 大 小 ， 而 且 大 
小 至 少 是 8 位。) 任何 多 字 节 编码 的 一 个 子 集 是 基本 C 字符 集 ， 其 中 
每 个 字符 都 是 一 个 长 度 为 1 的 序列 。 

CO 宽 字 节 字 符 是 wchar 上 类 型 的 整数 ，wchar t ft «stddef.h» 和 
<stdlib.h> 中 都 有 定义 。( 假 设 wchar t 可 以 是 从 char 到 unsigned 
long 之 间 的 任意 整数 类 型 .) 这 样 的 整数 可 以 表示 大 字符 集中 每 -一 个 字 
符 的 不 同 编码 。 基 本 C 字符 集中 的 编码 和 它们 的 单字 符 形式 的 值 相 同 。 


多 字 节 字符 便于 程序 和 外 部 世界 之 间 的 通信 。 磁 质 存 储 和 通信 连接 的 发 展 已 
经 足以 支持 8 位 字符 的 序列 。 宽 字 节 字符 便于 程序 内 部 的 文本 操作 ， 它 们 的 
固定 大 小 简化 了 对 单个 字符 和 字符 数组 的 处 理 。 


C 标准 仅仅 作 了 能 够 支持 这 两 种 编码 的 最 少 的 定义 。mblen、mbstowcs 
和 mbtowc 把 多 字 节 字符 转换 为 宽 字 节 字 符 ，wcstombs 和 wctomb 执行 相反 
的 操作 。 我 们 相信 一 些 更 加 详细 的 函数 将 会 很 快 被 标准 化 。 然 而 ， 现 在 ， 我 
们 所 能 使 用 的 就 这 么 多 。 

用 户 可 能 不 会 立即 打算 编写 可 以 方便 处 理 大 字符 集 的 程序 ， 但 这 不 会 阻 
止 用 户 编写 出 尽 可 能 多 地 容许 大 字符 集 的 程序 。 例 如 ， 看 一 下 这 样 的 字符 如 
何以 <stdio.h> 中 的 打印 和 扫描 函数 以 及 <time.h> 中 声明 的 strftime 函数 
所 使 用 的 格式 出 现 。 
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EXTT FAILURE 


EXIT SUCCESS 


MB CUR MAX 


abort 


abs 


atexit 


下 面 对 <stdlib.h> 中 定义 的 每 个 宏和 声明 的 每 个 函数 分 别 加 以 说 明 。 

EXIT FAILURE 用 这 个 宏 作 为 exit 的 参数 或 者 main 函数 的 返回 值 来 报 
告 不 成 功 的 程序 终止 。 其 他 的 任意 非 零 值 对 不 同 的 操作 系统 可 能 有 不 同 的 含义 。 

EXIT_SUCCESS 一 一 使 用 这 个 宏 作为 exit 的 参数 或 者 main 函数 的 返回 值 
来 报告 成 功 的 程序 终止 ， 也 可 以 使 用 零 。 其 他 的 任何 值 对 不 同 的 操作 系统 可 
能 有 不 同 的 含义 。 

MB CUR MAX 一 在 当前 的 区 域 设置 下 ， 只 定义 了 一 个 宽 字 节 字 符 的 多 字 
节 序 列 不 能 比 MB CUR MAX 长 。 可 以 声明 一 个 大 小 为 MB_LEN MAX (<limits. 
h> 中 定义 ) 的 字符 缓冲 区 ， 然 后 把 MB_CUR_MAX 个 字符 安全 地 存储 为 这 个 
缓冲 区 的 初始 元 素 。 用 不 小 于 MB CUR MAX 的 第 三 个 参数 调用 mbtowc， 足 
以 让 函数 确定 一 个 有 效 的 多 字 节 序列 中 的 下 一 个 宽 字 节 字符 ， 参 考 本 书后 面 
wctomb 的 例子 。 

RAND MAX 一 一 使 用 这 个 值 去 除 rand 的 返回 值 的 。 例 如 ， 如 果 需 
要 分 布 在 [0.0,1.0] 区间 上 的 float 类 型 的 随机 数 ， 就 可 以 使 用 表达 式 
(ELoat)rand() /RAND_MAX。RAND_MAX 的 值 至 少 为 32 767. 


size t 参考 11.3 节 。 
wchar t 参考 11.3 节 。 


div t 一 一 声明 一 个 这 种 类 型 的 数据 对 象 来 存储 div 的 返回 值 ，Giv 将 在 
下 面 描述 。 

ldiv_t 一 一 声明 一 个 这 种 类 型 的 数据 对 和 象 来 存储 19iv 的 返回 值 ，lqiv 
将 在 后 面 描述 。 

abort 一 一 只 有 当 程 序 出 现 严 重 问 题 的 时 候 才 调用 这 个 函数 ， 它 有 效 地 
调用 第 13 章 中 描述 的 raise (SIGABRT)， 这 会 让 SIGABRT 的 信号 处 理 程序 
去 完成 最 后 的 所 有 操作 。 另 一 方面 ， 不 能 保证 输入 /输出 流 已 经 被 清空 ， 文 
件 已 经 被 正确 关闭 或 者 临时 文件 已 经 被 删除 了 。 在 一 般 情况 下 ， 不 要 调用 
abort 而 调用 exit (EXIT FAILURE), 

abs 一 一 调用 abs (x) 来 代替 表达 式 x<0?-x:x。 越 来 越 多 的 标准 C 翻译 
器 为 abs 生成 比 上 面 的 表达 式 更 短 而 且 更 快 的 内 联 代 码 。 另 外 ， 使 用 它 还 可 
以 避免 由 于 粗心 而 对 一 个 表达 式 进行 两 次 求 值 所 造成 的 副作用 。 注 意 ， 在 一 
个 使 用 2 的 补 码 的 机 器 中 ，abs 可 能 会 造成 溢出 。( 参 考 541.) 
使 用 这 个 函数 注册 程序 快 结束 时 调用 的 另 一 个 函数 。 例 如 ， 
用 户 可 能 创建 了 很 多 临时 文件 ， 在 程序 结束 前 希望 把 它们 删除 。 可 以 编写 函 
数 void tidy (void) 来 移 除 这 些 文件 。 一 旦 存储 了 第 一 个 要 删除 的 文件 名 ， 
就 调用 atexit (&tidy). % main 函数 返回 或 者 有 函数 调用 exit 时 ， 库 就 


atexit 


atof 


atoi 


atol 
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会 按照 注册 的 反 顺 序 调用 atexit 注册 的 所 有 函数 ， 而 且 会 在 调用 所 有 注册 
的 函数 后 清空 流 、 关 闭 文件 和 删除 临时 文件 。 使 用 atexit 最 多 可 以 注册 32 
个 函数 。 

atof———atof (s) 和 strtod (s, NULL) 等 价 ， 只 不 过 atoef 不 会 把 
ERANGE 存储 在 errno 中 来 报告 一 个 范围 错误 。( 参 考 第 13 章 ) 使 用 atof 也 
不 能 知道 s 指向 的 串 中 有 多 少 字符 参与 了 转换 。 所 以 ， 最 好 使 用 strtod 来 
代替 它 。 


atoi 一 一 使 用 (int) strtol (s, NULL, 10) 来 代替 atoi (s)。 然 后 可 
以 考虑 修改 第 二 个 参数 以 确定 多 少 字符 参与 了 转换 。 其 中 的 原因 可 以 参考 上 
面 对 atof 的 讨论 。 

atol 一 一 使 用 strtol (s, NULL, 10) 来 代替 atol (s)， 其 中 的 原因 可 
以 参考 上 面 对 atof 和 atoi 的 讨论 。 


bsearch 一 一 这 个 函数 用 来 搜索 任意 一 个 数组 ， 这 些 数 组 的 元 素 通 过 两 
两 比较 进行 排序 ， 也 可 以 提供 一 个 比较 函数 来 定义 它们 的 顺序 。 例 如 ， 可 以 
用 下 面 的 基本 形式 构建 一 个 关键 字 查找 函数 : 


#include <stdlib.h> 
#include <string.h> 


typedef enum {FLOAT, INTEGER) Code; 
typedef struct { 

char *s; 

Code code; 

} Entry; 
Entry symtab[] = { 

{"float", FLOAT}, 

{"integer", INTEGER} } 


static int cmp(const void *ck, const void *ce) 
{ /* compare key to table element */ 
return (strcmp ( (char *) ck, ( (Entry *) ce) -s) ) ; 
} 


Entry *lookup (char *key) 
{ /* lookup key in table */ 
return (bsearch (key, symtab, 
sizeof symtab / sizeof symtab[0], 
sizeof symtab[0], &cmp) ); 
} 


下 面 是 一 些 注 意 事项 : 

O 如 果 关 键 字 和 两 个 或 者 更 多 个 元 素 相等 ，bsearch 返回 的 指针 可 能 指 
向 这 些 元 素 中 的 任何 一 个 。 

O 当 执 行 字 符 集 改变 时 ， 要 注意 元 素 排 序 方式 的 改变 一 一 用 一 个 兼容 的 
比较 函数 调用 asort 《下面 会 讲 ) 来 保证 数组 被 正确 排序 。 
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calloc 


exit 


free 


O {E <string.h> 中 声明 的 函数 stremp 或 者 strcoll HE. È 
们 两 个 都 要 求 字 符 串 存储 在 待 搜索 的 数组 中 。 不 能 用 它们 来 搜索 指 
向 字符 串 的 指针 数组 。 例 如 ， 要 使 用 strcmpp， 就 必须 编写 一 个 形 如 
(int(*)(const void *,const void *))&strcomp 的 函数 指针 参数 。 
calloc 一 一 使 用 这 个 函数 来 分 配 一 个 数组 数据 对 象 ， 并 且 在 组 成 这 个 数 
据 对 象 的 所 有 字符 中 都 存储 为 0。 可 以 假设 任何 字符 类 型 的 大 小 都 是 1， 但 是 
要 使 用 运算 符 sizeof 来 确定 第 二 个 参数 ， 不 能 把 第 二 个 参数 的 值 指定 为 0。 
为 了 最 大 限度 的 可 移植 ， 不 要 认为 任何 浮 点 值 都 能 变 为 0 或 者 任何 指针 
都 可 以 变 为 空 指针 。 它 们 可 能 是 这 样 ， 但 并 不 一 定 是 。 也 不 能 假设 两 个 参数 
的 乘积 就 是 所 需要 的 空间 大 小 。 一 个 实现 可 以 根据 第 二 个 参数 指定 的 大 小 为 
分 配 的 数据 对 象 选择 一 种 存储 对 齐 方式 。 因 此 ， 应 该 按 以 下 形式 分 配 空间 : 
O 一 个 有 N 个 元 素 的 整 型 数组 用 calloc (N,sizeof (int)) 分 配 ; 
D 一 个 struct x 类 型 的 数据 对 象 用 calloc (1, sizeof (struct x) 
分 配 。 


div 


调用 div 可 能 是 由 于 下 面 的 某 个 原因 。 
O 不 管 在 具体 的 实现 中 操作 符 / 和 gs 的 行为 怎样 ，div 总 是 计算 向 零 
趋 近 的 商 和 相应 的 余数 。 当 其 中 一 个 操作 数 为 负 时 这 很 重要 。 表 达 式 
(-3) /2 可 能 产生 -2 或 者 -1， 而 div(-3,2).quot 总 是 产生 -1。 类 
似 地 ，(-3)%2 会 得 到 1 或 者 -1， 而 div(-3,2).rem 总 是 得 到 -1。 
O div 同时 计算 商 和 余数 ， 当 需要 这 两 个 结果 时 这 就 很 方便 。 如 果 函 数 
展开 为 只 包括 单一 除法 的 内 联 代 码 ， 它 可 能 会 更 有 效 。 
注意 ， 最 后 返回 的 结构 类 型 div_t 的 成 员 可 以 按照 任何 顺序 排列 。 不 要 对 这 
种 结构 的 表示 方式 做 任何 的 假设 。 
调用 exit 可 以 在 一 个 程序 内 部 的 任何 地 方 终止 程序 的 执行 。 
在 main 函数 中 既 可 以 调用 exit， 也 可 以 使 用 return i£]. exit 的 参数 
(或 者 main 的 返回 信 ) 应 该 为 零 或 者 上 面 描述 的 EXIT SUCCESS 来 报告 成 功 
的 终止 ;否则 ， 它 应 该 是 上 面 描述 过 的 EXIT FAILURE. 
free 一 一 使 用 这 个 函数 来 释放 程序 前 面 调用 calloc、malloc 或 者 
realloc 分 配 的 存储 空间 。 可 以 安全 地 用 一 个 空 指针 调用 free。( 这 种 情况 
下 这 个 函数 什么 也 不 做 。) FU, free 的 参数 必须 是 以 上 3 个 函数 中 的 一 个 
返回 的 值 p。 不 要 调用 free (char *) pN) 来 释放 前 N 个 分 配 的 字符 之 后 
的 空间 调用 realloc (p,N)。 一 旦 调用 了 free (p)， 就 不 要 在 任何 表达 
式 中 访问 p 中 的 当前 值 一 一 一 些 计算 机 体系 结构 可 能 会 把 这 种 访问 作为 致命 
的 错误 来 对 待 。 


exit 


getenv 
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用 户 没有 义务 释放 分 配 的 空间 ， 但 尽早 地 释放 所 有 分 配 的 空间 是 一 个 很 
好 的 原则 。 有 杰 放 的 空间 可 以 被 重新 分 配 ， 来 更 好 地 利用 有 限 的 资源 。 而 且 ， 
某 些 实现 会 在 程序 终止 的 时 候 报告 分 配 的 空间 ， 这 可 以 帮助 用 户 找到 由 于 粗 
心 而 没有 释放 的 空间 。 


getenv 一 一 使 用 这 个 函数 来 获得 指向 一 个 环境 变量 相关 的 数值 串 的 指针 
(参考 6.1 节 )。 如 果 用 户 命名 了 一 个 没有 定义 的 环境 变量 ， 就 会 得 到 一 个 空 
指针 作为 函数 的 值 。 用 户 不 能 改变 这 个 串 值 。 然 而 ， 后 面 对 getenv 的 调用 
会 改变 这 个 串 。 要 分 配 一 个 私有 的 副本 ， 可 以 编写 类 似 下 面 的 代码 ; 


#include <stdlib.h> 


char *copyenv (const char *name) 
{ /* get and copy environment variable */ 
char *sl = getenv(name) ; 


char *s2 = sl ? malloc(strlen(si) + 1) : NULL; 
return (s2 ? strcpy (s2, sl) : NULL); 

labs 一 一 参考 上 面 对 abs 的 讨论 。 

ldiv 一 一 参考 上 面 对 aiv 的 讨论 。 


malloc 一 一 参考 上 面 对 calloc 的 讨论 。 使 用 malloc 来 为 一 个 人 工 初始 
化 的 数据 对 象 分 配 空间 。 如 果 数 据 对 象 只 包括 整数 ， 并 且 用 户 希望 它们 都 设 
置 为 零 ， 就 调用 calloc 而 不 用 malloc. calloc 的 第 二 个 参数 的 注意 事项 也 
适用 于 malloc 的 参数 。 


mblen 一 一 使 用 这 个 函数 来 确定 只 定义 了 一 个 宽 字 节 字符 的 多 字 节 序列 
的 长 度 ， 该 长 度 不 能 比 <stdlib.h> 中 定义 的 MB CUR MAX 大 。 多 字 节 序列 可 
以 包含 锁定 转移 ， 它 能 改变 对 后 面 任意 数目 的 字符 的 解释 。 因 此 ，rmblen 在 
一 个 私有 的 静态 数据 对 象 中 存储 当前 正在 扫描 的 多 字 节 串 的 转移 状态 。 如 果 
mblen (NULL,0) 的 调用 为 非 零 ， 那 么 就 可 以 通过 重复 地 调用 mblen 来 安全 
地 扫描 多 字 节 串 ， 每 次 只 能 扫 摘 一 个 多 字 节 串 。 例 如 ， 下 面 是 一 个 检查 多 字 
节 串 是 否 有 一 个 有 效 的 编码 的 函数 : 


#include <stdlib.h> 


int mbcheck(const char *s) 
{ /* return zero if s is valid */ 
int n; 


for (mblen(NULL, 0); ; s += n) 
if ( (m = mblen (s, MB_CUR_MAX) ) <= 0) 
return (n); 
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mbstowcs 


mbtowc 


qsort 


rand 


<stdlib.h> 


mbstowcs 一 一 使 用 这 个 函数 把 整个 多 字 节 字符 串 转 换 为 一 个 宽 字 节 字符 
串 。 不 需要 担心 是 否 发 生 了 锁定 转移 ， 因 为 这 个 函数 是 对 整个 多 字 节 串 进行 
处 理 。 也 不 用 担心 生成 的 宽 字 节 字 符 串 太 长 ， 因 为 第 三 个 参数 mn 限制 了 存储 
的 元 素 的 数目 。 如 果 函 数 返回 了 一 个 大 于 或 者 等 于 的 值 ， 则 这 个 转换 是 不 
完全 的 。 如 果 函 数 返回 一 个 负 值 ， 那 么 多 字 节 串 的 编码 是 无 效 的 。 


mbtowc 一 一 这 个 函数 的 使 用 和 上 面 描述 过 的 molen 的 使 用 基本 相同 。 这 
两 个 函数 存在 以 下 两 点 不 同 。 


D 如 果 mbtowc 的 第 一 个 参数 不 是 一 个 空 指针 ， 那 么 函数 返回 它 转换 的 
宽 字 节 字 符 。 因 此 ， 它 一 次 可 以 转换 一 个 宽 字 节 字 符 ， 而 mbstowcs 
一 次 可 以 转换 整个 串 。 

CJ 函数 mblen Fil mbtowc 保持 了 单独 的 静态 数据 对 象 以 存储 转移 状态 。 
因此 ， 即 使 当 多 字 节 串 具 有 锁定 转移 的 时 候 用 户 也 可 以 使 用 这 两 个 函 
数 同 时 扫描 不 同 的 串 。 


qsort 一 一 使 用 这 个 函数 可 以 对 任意 一 个 数组 进行 排序 ， 该 数组 的 元 素 
通过 两 两 比较 来 排序 。 用 户 可 以 提供 一 个 比较 函数 来 定义 它 的 顺序 。 这 个 
比较 函数 的 说 明和 上 面 所 说 的 bsearch 的 比较 函数 的 说 明 相 似 。 不 同 的 是 ， 
bsearch 的 比较 函数 对 关键 字 和 一 个 数组 元 素 进行 比较 ， 而 sort 比较 函数 对 
两 个 数组 元 素 进行 比较 。 


下 面 是 几 点 注意 事项 。 


D 不 管 函 数 的 名 字 是 什么 ， 都 不 要 认为 它 使 用 的 是 “快速 排序 ”算法 ， 
因为 可 能 不 是 。 如 果 两 个 或 者 更 多 的 元 素 相等 ，qsort 可 能 会 按照 任 
何 相关 顺序 保留 这 些 元 素 。 因 此 ，qsort 不 是 稳定 的 排序 。 
DO 当 执 行 字符 集 改变 时 要 知道 元 素 排序 方式 的 改变 。 
D 使 用 <string.h> 中 声明 的 函数 strcmp 和 strcoll 时 要 小 心 。 这 两 
个 函数 都 要 求 进行 排序 的 串 存 储 在 数组 中 。 不 能 使 用 它们 对 一 个 指 
向 字符 串 的 指针 数组 进行 排序 。 例 如 ， 要 使 用 strcmp， 必 须 使 用 类 
LF (int (*) (const void *,const void *))&strcmp 的 方式 编 
写 一 个 函数 指针 参数 。 
rand 一 一 调用 rand 来 获得 一 个 伪 随 机 数 序 列 中 的 下 一 个 数 。 对 于 一 个 
确定 的 参数 值 ， srand 下面 会 描述 ) 的 每 一 次 调用 都 会 得 到 相同 的 随机 数 - 
序列 。 这 经 常 是 人 们 想 要 的 结果 ， 特 别 是 当 调 试 程序 的 时 候 。 如 果 想 得 到 不 
可 预见 的 行为 ， 可 以 通过 调用 <time.h> 中 声明 的 clock 或 者 time 来 获得 
srand 的 一 个 参数 。zang 的 行为 在 不 同 的 实现 中 可 能 会 变化 很 大 。 如 果 希 望 
一 直 都 能 得 到 相同 的 伪 随 机 数 序列 ， 可 以 复制 13.2 节 的 例子 。 


realloc 


strtod 


图 13-1 
strtod 模式 


strtol 
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realloc 一 一 这 个 函数 通常 用 来 使 前 面 分 配 的 数据 对 象 变 得 更 大 或 者 更 
小 。 如 果 让 它 变 得 更 大 ， 则 存储 在 增加 的 部 分 的 值 没有 定义 。 如 果 让 它 变 
小 ， 则 存储 在 保留 的 部 分 的 值 不 变 。 然 而 ， 不 管 哪 种 情况 ， 函 数 都 有 可 能 
变数 据 对 象 存储 的 地 址 。 和 free (上 面 有 描述 ) 函数 一 样 ， 一 旦 realloc ik 
回 ， 用 户 就 不 能 在 任何 表达 式 中 访问 它 的 参数 值 。 可 以 用 malloc (size) Æ 
代替 realloc (NULL，size)。 上 面 描述 的 calloc 的 第 二 个 参数 的 注意 事项 
也 适用 于 realloc 的 第 二 个 参数 。 


srand 参考 上 面 对 rand 的 讨论 。rand 在 程序 启动 时 就 调用 了 
srand (1), 
strtod— —iA ph BOW 14 T ep CE <stdio.h> 中 声明 ) 调用 ， 用 来 把 


一 个 字符 序列 转换 为 一 个 double 类 型 的 编码 值 。 可 以 直接 调用 strtod 来 避 
免 扫 描 函 数 的 开销 。 这 样 也 可 以 更 精确 地 确定 字符 串 参 数 的 哪 部 分 参与 了 
转换 。 


注意 strtod 的 行为 会 随 着 区 域 设置 而 改变 。 这 个 函数 调用 isspace 来 
跳 过 开头 的 空白 。Plauger 和 Brodie 提供 的 图 13-1 给 出 了 它 遵 循 的 文本 模式 。 
这 里 ，point 和 当前 的 区 域 设置 中 定义 的 小 数 点 匹配 。 例 如 ， 这 个 图 告诉 我 
们 ， 下 面 都 是 表示 值 12 的 有 效 方式 :12、+12. 和 .12e2。 一 个 实现 也 可 以 
识别 "c" 之 外 的 区 域 设置 中 的 其 他 方式 。 


strtol 一 一 该 函数 为 扫描 函数 〈 在 <stdio.h> PAR) 调用 ， 用 来 把 一 
个 字符 序列 转换 为 一 个 long 类 型 编码 值 。 可 以 直接 调用 strtol 来 避免 扫描 
函数 的 开销 。 这 样 也 允许 指定 那些 不 常用 的 基数 ， 并 且 可 以 更 精确 地 确定 字 
符 串 参数 的 哪 一 部 分 参与 了 转换 。 


注意 strtol 的 行为 会 随 着 区 域 设 置 而 改变 。 这 个 函数 调用 isspace 来 
跳 过 开头 的 空白 。Plauger 和 Brodie 提供 的 图 13-2 给 出 了 它 遵循 的 文本 模式 。 
例如 ， 这 个 图 告诉 我 们 下 面 都 是 表示 12〈 假 设 strtol 的 第 三 个 参数 指定 基 
数 为 0) 的 有 效 形式 ，12、+014 和 0xc。 一 个 实现 也 可 以 识别 "6" 之 外 的 区 
域 设置 中 的 其 他 方式 。 
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图 13-2 
strtol 模式 


strtoul 


system 


westombs 


a-z 
A-Z 


strtoul 当 需 要 unsigned long 类 型 的 结果 时 ， 可 以 使 用 这 个 函数 
而 不 用 上 面 描述 的 strtol。 如 果 转 换 后 的 数值 比 <limits.h> 中 定义 的 
ULONG MAX K, RÅ strtoul 就 会 报告 范围 错误 。( 取 这 个 值 的 相反 数 不 会 
造成 溢出 。) 另 一 方面 ， 如 果 转 换 的 结果 比 LONG MIN 小 或 者 比 LONG MAX K, 


strtol 会 报告 范围 错误 。 图 13-2 也 描述 了 strtoul 遵循 有 效 的 文本 模式 。 


_system 一 一 我 们 不 会 强迫 实现 让 system 做 任何 有 用 的 事情 。 如 果 调 用 
system (NULL) 返回 一 个 非 零 值 ， 用 户 就 会 知道 这 个 函数 调用 了 某 个 类 别 的 
命令 处 理 程序 。 但 是 C 标准 对 这 样 的 创造 性 功能 没有 强加 任何 要 求 。system 
的 唯一 可 移植 的 用 处 就 是 提供 了 一 种 对 命令 处 理 程序 的 模糊 访问 。 例 如 ， 一 
个 编辑 器 可 能 会 接受 以 一 个 感叹 号 开头 的 一 行 语句 ， 它 把 这 行 中 剩余 的 部 分 
作为 一 个 字符 串 参数 传递 给 system。 本 地 的 命令 处 理 程序 怎样 解释 这 一 行 就 
不 是 我 们 关心 的 内 容 了 。 


使 用 这 个 函数 把 整个 宽 字 节 字 符 串 转换 为 一 个 多 字 节 串 。 
不 需要 担心 是 否 发 生 了 锁定 转移 ， 因 为 这 个 函数 是 对 整个 宽 字 节 字 符 串 进行 
处 理 。 也 不 用 担心 生成 的 多 字 节 串 太 长 ， 因 为 第 三 个 参数 n 限制 了 存储 的 元 
素 的 数目 。 如 果 函 数 返 回 一 个 比 大 或 者 和 nn 相等 的 值 ， 那 么 这 个 转换 就 是 
不 完整 的 。 如 果 函 数 返 回 一 个 负 值 ， 那 么 宽 字 节 字 符 串 是 无 效 的 。 


wctonb 一 一 使 用 这 个 函数 把 一 个 宽 字 节 字 符 串 转换 为 一 个 多 字 节 串 ， 一 
次 转换 一 个 宽 字 节 字 符 。 例 如 ， 这 里 有 一 个 检查 宽 字 节 字 符 串 的 编码 是 否 有 
效 的 函数 。 


wcstombs 


include «limits.h» 
#include <stdlib.h> 


int wccheck (wchar t *wcs) 
( /* return zero if wcs is valid */ 
char buf[MB LEN MAX]; 
int n; 


for (wctomb(NULL, 0 ) ; ; ++wcs) 
if ( (n = wctomb (buf , *wcs) ) <= 0 ) 
return (- 1); 
else if (buf [n - 1]='\0' ) 
return (0 ) ; 


) 


注意 wetomb 返回 的 计数 值 中 包括 了 终止 的 空 字符 ， 而 mbtowc 却 没有 。 
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13.4 «stdlib.h» 的 实现 


头 文件 


<stdlib.h> 


ZR EXFAIL 


数据 对 象 


 Mbcurmax 


类 型 Cmpfun 


函数 abs 


函数 div 


labs 
ldiv 
函数 asort 


就 像 13.1 节 指 出 的 那样 ，<stdlib.h> 中 声明 的 函数 被 分 为 6 个 不 类 相 
关 的 组 。 下 面 也 是 按照 说 明 的 顺序 列 出 了 这 6 个 分 组 。 但 是 我 们 首先 来 看 一 
下 头 文件 本 身 ， 即 使 它 包 含 了 很 多 神秘 的 东西 。 有 些 部 分 会 在 这 里 解释 ， 本 
章 的 后 面 会 解释 其 他 部 分 。 

图 13-3 显示 了 文件 stalib.h。 和 往常 一 样 ， 它 包含 了 内 部 头 文件 
<yvals.h> 中 的 一 些 定义 。 其 中 提供 了 3 个 重复 的 定义 一 一 宏 NULL、 类 型 
size t 和 wchar_t (参考 第 11 章 )。 还 有 一 个 是 «stdlib.h» 特有 的 一 一 宏 
_EXFAIL， 这 个 宏 确定 宏 EXIT_FAILURE 的 值 。 

C 标准 允许 每 个 系统 为 exit (A main 函数 的 返回 值 ) 指定 两 个 首选 
的 参数 值 。 宏 EXIT FAILURE 报告 失败 的 终止 ， 宏 EXIT SUCCESS 报告 成 功 
的 终止 。 由 于 一 些 历 史 原 因 ， 值 0 也 报告 成 功 的 终止 。 因 此 ， 这 里 只 修改 报 
告 失败 的 终止 的 编码 。 宏 _EXFAIL 通常 情况 下 值 为 1。 | 

当 区 域 设 置 类 别 LC_CTYPE 改变 时 ， 宏 MB_CUR_MAX 的 值 也 会 改变 。 它 产 
生 的 值 是 存储 在 文件 xstate.c 中 定义 的 数据 对 象 Mbcurmax 中 的 值 (参考 
图 6-11) 

我 引入 _cmpfun 类 型 只 是 为 了 使 函数 bsearch 和 gqsort 的 参数 声明 更 
加 简单 。 如 果 希 望 代 码 可 以 移植 到 其 他 实现 下 ， 那 么 就 不 要 使 用 这 个 声明 。 
《其 他 的 私有 名 字 会 在 后 面 解释 。) 

图 13-4 显示 了 文件 aps.c。 绝 对 值 函数 abs 是 最 简单 的 整 型 数学 函数 。 
然而 ， 却 不 能 提供 一 个 屏蔽 宏 ， 因 为 我 们 必须 两 次 访问 参数 的 值 。 某 些 计 算 
机 体系 结构 下 计算 绝对 值 有 特殊 的 指令 ， 这 就 使 得 我 们 首先 考虑 把 abs 作为 
生成 内 联 代码 的 内 置 函 数 处 理 。 

图 13-5 显示 了 文件 div.c， 它 提供 了 div 函数 的 一 个 可 移植 的 实现 。 如 
果 用 户 知道 负 商 向 零 截断 ， 那 么 就 可 以 取消 测试 。 大 多 数 计算 机 体系 结构 都 
有 同时 产生 商 和 余数 的 除法 指令 ， 因 此 那些 生成 正确 负 商 的 函数 也 是 内 置 函 
数 的 候选 。 一 个 实现 可 以 自由 地 对 结构 体 类 型 div 的 成 员 的 顺序 进行 设置 
来 使 它们 和 硬件 产生 的 结果 相 匹 配 。 

图 13-6 显示 了 文件 labs.c, 图 13-7 显示 了 文件 19iv.c。 这 两 个 文件 都 
只 是 定义 了 函数 abs 和 div 的 long 类 型 版 本 。 

图 13-8 显示 了 文件 qsort.c， 它 定义 了 函数 qsort， 该 函数 是 对 首 元 
素 地 址 为 base 的 数组 进行 排序 。 函 数 使 用 的 思想 不 太 简 单 且 有 争议 。 它 以 
C.A.R.Hoare 首次 提出 来 的 快速 排序 算法 为 基础 。 该 算法 要 求 先 选取 一 个 枢 
纽 元 素 以 将 数组 中 的 元 素 分 为 两 个 部 分 ， 然 后 分 别 对 每 一 部 分 进行 排序 。 然 
后 ， 就 可 以 递归 地 使 用 这 种 技术 对 每 个 部 分 分 别 进行 排序 。 这 种 算法 的 排序 
速度 可 能 会 很 快 ， 也 可 能 会 很 慢 。 
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51-3 [/* stalib.h standard header */ 
stdlib.h *ifndef _STDLIB 
#define _STDLIB 
#ifndef _YVALS 
#include «yvals.h» 
fendif 


/* macros */ 
#define NULL NULL 
#define EXIT FAILURE . EXFAIL 
#define EXIT SUCCESS 0 
#define MB CUR MAX  Mbcurmax 
#define RAND MAX 32767 
/* type definitions */ 
#ifndef  SIZET 
#define , SIZET 
typedef Sizet size t; 
fendif 
#ifndef  WCHART 
#define , WCHART 
typedef _Wchart wchar t ; 
#tendif 
typedef struct { 
int quot; 
int rem; 
) div t; 
typedef struct ( 
long quot; 
long rem; 
) ldiv t; 
typedef int | Cmpfun(const void *, const void *) ; 
typedef struct ( 
unsigned char State; 
unsigned short | Wchar; 
) Mbsave; 
/* declarations */ 
void abort (void) ; 
int abs (int) ; 
int atexit (void (*) (void) ) ; 
double atof (const char *) ; 
int atoi(const char *) ; 
long atol (const char *) ; 
void *bsearch (const void *, const void *, 
Size t, size t,  Cmpfun *); 
void *calloc (size t , size t) ; 
div t div (int, int) ; 
void exit (int) ; 
void free (void *) ; 
char *getenv (const char *) ; 
long labs (long) ; 
ldiv t ldiv (long, long) ; 
void *malloc(size t); 
int mblen(const char *, size t) ; 
Size t mbstowcs(wchar t *, const char *, size t); 
int mbtowc (wchar t*, const char *, size t) ; 
void qsort (void*, size t , size t , Cmpfun *) ; 
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图 13-3 
( 续 ) 


图 13-4 
abs.c 


图 13-5 
div.c 


int rand (void) ; 
void *realloc (void *, size t) 
void srand(unsigned int ) 


H 


; 


double strtod(const char *, char **); 
long strtol (const char* , char ** , int) ; 
unsigned long strtoul (const char*, char ** , int) ; 


i 


int system(const char *); 
size_t wcstombs (char *, const wchar_t *, size_t) 
int wctomb (char*, wchar t) ; 
int Mbtowc (wchar t*, const char*, size t 
double _Stod(const char *, char **) ; 
unsigned long _Stoul(const char *, char **, int ) 
int Wctomb(char *, wchar t, char *); 
extern char _Mbcurmax , _Wextomb; 
extern Mbsave _Mbxlen, | Mbxtowc; 
extern unsigned long | Randseed; 

/* macro overrides */ 
#define atof (s) _Stod(s, 0) 
#define atoi (s) (int) Stoul (s, 0, 10) 
#define atol (s) (long) Stoul (s, 0, 10) 
#define mblen(s, n) Mbtowc(0, s, n, & Mbxlen) 
#define mbtowc (pwc, s, n) _Mbtowc(pwc, s, n, & Mbxtowc) 


; 
, _Mbsave *) ; 


H 


#define srand(seed) (void) ( Randseed = (seed) ) 
#define strtod(s, endptr) _Stod(s, endptr) 
#define strtoul (s, endptr,base)  Stoul(s,endptr , base) 


#define wctomb (s, wchar) | Wctomb (s, wchar, & Wcxtomb) 
#endif 


/* abs function */ 
#include <stdlib.h> 


int (abs) (int i) . 
{ /* compute absolute value of int argument */ 
return ( (i < 0) ? ~i : i); 


} : m 


/* div function */ 
#include «stdlib . h> 


div t (div) (int numer, int denom) 


{ /* compute int quotient and remainder */ 
div_t val; 


val.quot = numer / denom; 
val.rem = numer - denom * val.quot; 


if (val.quot < 0 && 0 < val.rem) 
{ /* fix remainder with wrong sign * / 
val.quot += 1; 
val.rem -= denom; 
} 
return (val); 


} 
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图 13-6 
labs.c 


图 13-7 
ldiv.e 


13-8 
qsort.c 


/* labs function */ 
#include <stdlib.h> 


long (labs) (long i 
{ /* compute absolute value of long argument */ 
return (li < 0) ? -i : i); 7 


} 


/* ldiv function */ 
#include <stdlib.h> 


ldiv t (ldiv) (long numer, long denom) 
H /* compute long quotient and remainder */ 
idiv t val; 


val.quot - numer / denom; 
Val.rem - numer - denom * val.quot; 
if (val.quot « 0 && 0 « val.rem) 
H /* fix remainder with wrong sign */ 
val.quot += 1; 
val.rem -= denom; 
H 
return (val); 


} 


/* qsort function */ 
#include <stdlib.h> 
#include <string.h> 


/* macros */ 
#define MAX_BUF 256 


/* chunk to copy on swap */ 


void (qsort)( void *base, size_t n, size_t size, _Cmpfun *cmp) 


{ /* sort (char base[size]) [n] using quicksort */ 
while (1 < n) 
{ /* worth sorting */ 
size_t i= 0; 
size tj=n- 1; 
char *qi = (char *)base; 
char *qj = qi + size*j; 


char *qp ai; 


while (i i) 
H /* partition about pivot */ 
while (i « j && (*cmp)(qi, ap) <= 0) 

++i, gi += size; 
while (i < j && (*cmp)(qp, qj) <= 0) 
--j. qj -= size; 
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(5) 


if (i « j) 
{ /* swap elements i and j */ 
char buf [MAX BUF] ; 
char *g1 = qi; 
char *q2 = qj; 
size_t m, ms; 


for (ms = size; 0 < ms; 
ms -- m, ql += m, q2 -= m) 
1 /* swap as many as possible */ 
m = ms < sizeof (buf) ? ms : sizeof (buf); 


memcpy (buf, ql, m); 
memcpy(ql, q2, m); 
memcpy(q2, buf, m) ; 


H 
++i, qi += size; 
} 
} 
if (qi ! =qp) 
{ /* swap elements i and pivot */ 


char buf [MAX BUF]: 
char *ql = qi; 
char *q2 = qp; 
size_t m, ms; 


for (ms = size; 0 < ms; ms -= m, ql += m, q2 -= m) 
{ /* swap as many as possible */ 
m = ms < sizeof (buf) ? ms : sizeof (buf); 


memcpy (buf, gi, m); 
memcpy (ql, q2, m); 
memcpy(q2, buf, m); 
H 
} 
j=mn-i - 1, qi += size; 
if (j < i) 


{ /* recurse on smaller partition */ 
if (1 < j) 
qsort (qi, j, size, cmp); 
n-i; 
) 
else 
{ /* lower partition is smaller */ 


if (1 < i) 
qsort(base, i, size, cmp); 
base = qi; 
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图 13-9 


bsearch.c 


å bsearch 


AŽ rand 


/* bsearch function */ 
#include <stdlib.h> 


void *(bsearch) (const void *key, const void *base, 
size_t nelem, size_t size, _Cmpfun *cmp) 
{ /* search sorted table by binary chop */ 
const char *p; 
size tn; 


for (p = (const char *)base, n - nelem; 0 « n; ) 
{ /* check midpoint of whatever is left */ 
const size t pivot = n >> 1; 
const char *const q - p + size * pivot; 
const int val = (*cmp) (key, q); 


if (val < 0) 

n = pivot; /* search below pivot */ 
else if (val == 0) 

return ((void *)q); /* found */ 
else 
/* search above pivot */ 


) 
return (NULL) ; /* no match */ 
) 


怎样 选择 最 好 的 枢 轴 元 素 是 一 个 有 争议 的 话题 。 如 果 选 择 第 一 个 元 素 ， 
则 已经 排 好 序 的 数组 就 会 耗费 很 多 时 间 。 如 果 选 择 最 后 一 个 元 素 ， 则 一 个 逆 
序 的 数组 会 耗费 很 多 时 间 。 如 果 在 选择 枢 轴 元 素 上 花费 很 多 工夫 ， 那 么 所 有 
的 数组 都 会 耗费 很 长 的 时 间 。 我 选择 了 最 后 一 个 元 素 ， 这 对 基本 有 序 的 数组 
很 有 效 。 当 然 ， 每 个 人 都 有 理由 选择 其 他 的 方法 。 


asort 调用 它 本 身 对 两 部 分 中 较 小 的 一 个 进行 排序 ， 并 通过 内 部 循环 对 
较 大 的 一 部 分 进行 排序 。 这 就 使 对 动态 存储 空间 的 要 求 降 到 了 最 小 。 最 坏 
的 情况 是 ， 每 一 次 递归 调用 都 会 对 一 个 大 小 为 上 次 调用 的 一 半 的 数组 进行 
排序 。 对 NN 个 元 素 进 行 排序 所 需要 的 递归 深度 不 会 超过 log2(N)。( 对 一 个 有 
1000 000 个 元 素 的 数组 进行 排序 时 ， 最 多 调用 20 次 。) 


图 13-9 显示 了 文件 bsearch.c. MÅ bsearch 对 一 个 以 base 为 首 地 址 
且 排 好 序 的 数组 执行 二 元 搜索 。 这 种 方法 很 简单 ， 但 也 容易 出 错 。 


图 13-10 显示 了 文件 rand.c. MM rand 使 用 C 标准 推荐 的 算法 产生 一 
个 伪 随 机 数 序列 〈 参 考 13.2 节 )。 这 种 算法 有 合理 的 特性 ， 而 且 被 广泛 使 用 。 
随机 数 生成 器 的 其 中 一 个 优点 就 是 它 的 随机 性 。 另 外 一 个 优点 是 可 重复 性 ， 
这 是 有 讽刺 意义 的 。 用 户 经 常 需 要 确认 在 伪 随 机 数 基础 上 的 计算 是 否 能 够 得 


图 13-10 


rand.c 


13-11 


srand.c 


BS srand 


函数 stoul 
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/* rand function */ 
finclude <stdlib.h> 


/* the seed */ 
unsigned long  Randseed = 1; 


int (rand) (void) 
{ /* compute pseudo-random value */ 
_Randseed = _Randseed * 1103515245 + 12345; 
return ((unsigned int) (_Randseed >> 16) & RAND MAX) ; 
} 


/* srand function */ 
#include <stdlib.h> 


void (srand) (unsigned int seed) 
/*alter the seed */ 
_Randseed = seed; 


} l D 


到 想 要 的 结果 。 这 种 算法 执行 时 使 用 unsigned long 整数 来 避免 溢出 。 

图 13-11 显示 了 文件 srand.c。 函 数 srand 只 是 对 _Randseed 进行 设 
@, Randseed 是 rand 生成 伪 随 机 数 序列 的 种 子 。 我 为 srand 提供 了 一 个 
屏 项 宏 ， 因 此 ， 头 文件 <stdlib.h> 声明 了 rand.c 中 定义 的 Randseed, 


图 13-12 显示 了 文件 xstoul.c。 它 定义 了 函数 _Stoul， 这 个 函数 执行 
所 有 从 文本 串 到 编码 整数 的 转换 。 这 个 函数 的 说 明和 strtoul 的 相同 ， 我 把 
它 独 立 出 来 是 为 了 使 <stdlib.h> 中 定义 的 几 个 屏蔽 宏 能 够 直接 调用 它 。( 在 
某 些 环境 下 ， 名 字 strtoul 可 以 被 重新 定义 。) 

—Stoul 的 前 半 部 分 确定 基数 并 对 最 高 有 效 数字 进行 定位 。 这 就 涉及 了 去 
掉 开头 的 空白 、 识 别 所 有 的 符号 和 去 掉 类 似 于 Ox FKA RTR. RSA BE 
过 开头 的 所 有 零 ， 这 样 它 就 可 以 计算 出 它 要 转换 的 数 的 有 效 数 字 的 个 数 。 不 
管 是 否 发 生 了 汶 出 ， 函 数 都 转换 所 有 的 有 效 数 字 。 对 使 用 unsigned long 的 算 
法 来 说 ， 溢 出 不 会 造成 异常 。 

_Stoul 首先 通过 检测 有 效 数字 的 个 数 来 对 溢出 进行 粗略 的 检查 。 这 个 
版 本 假设 一 个 unsigned long 占据 32 位 。( 如 果 这 样 的 整数 更 大 的 话 ， 就 改变 
数组 ndaigs。) 对 每 一 个 有 效 的 基数 ，ndigs [base] 是 可 能 发 生 溢 出 的 数字 个 
数 。 因 此 ， 一 个 比 它 短 的 序列 不 会 发 生 溢 出 ， 而 比 它 长 的 一 定 会 。 一 个 临界 
长 度 的 序列 需要 进一步 的 检查 。 把 最 后 一 位 去 掉 ， 看 看 是 否 又 得 到 了 前 面 累 
加 的 值 ‘y)。 如 果 不 是 ， 就 说 明 发 生 了 溢出 。 


<stdlib.h> 


/* _Stoul function */ 
#include <stdlib.h> 
#include <ctype.h> 
#include <errno.h> 
#include <limits.h> 
#include <stddef.h> 
#include <string.h> 


/* macros */ 
#define BASE_MAX 36 
/* static data */ 
static const char digits[] = { 
"0123456789abcdefghijklmnopqrstuvwxyz"); 
Static const char ndigs[BASE MAX«1] - ( 
0, 0, 33, 21, 17, 14, 13, 12, 11, 11, 
10, 10, 9, 9, 9, 9, 9, 8, 8, 8, 


8, 8, 7, 7, 7, 
7, 7, 7, 


7, 


/* largest valid base 


/* valid digits 


/* 32-bits! 


unsigned long | Stoul(const char *s, char **endptr, int base) 
{ /* convert string to unsigned long, with checking 


const char *sc, 
const char *s1, 
char sign; 
ptrdiff_t n; 
unsigned long x, y; 


*sd; 
*s2; 


for (sc = s; isspace(*sc); ++SC) 


H 


sign = *sc == '-' || *sc == '+' ? *SC++ 


if (base « 0 || base == 1 || BASE MAX < base) 


{ 
if (endptr) 
*endptr = (char *)s; 
return (0); 
} 
else if 
{ 
if (base == 16 && *sc == '0' 
&& (sc[1] == 'x' || sc[1] == 'X')) 
sc += 2; 


(base) 


} 
else if (*sc 
base 
else if 
base 
. else 
base 
for (sl 


‘4; 


/* silly base */ 


/* strip Ox or OX */ 


skip leading zeros */ 


Æ 13-12 
GE) 


Æ 13-13 


atoi.c 


图 13-14 


atol.c 


图 13-15 


strtoul.c 
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for (s2 = sc; (sd = memchr (digits, 
tolower (*sc) , base)) != NULL; 


{ 

Y = X; 

x = x*base + (sd - digits); 
} 


if (si == sc) 
{ 
if (endptr) 
*endptr = (char *)s; 
return (0); 
} 
n= sc ~ 82 - ndigs [base]; 
if (n < 0} 
else if (0 <n || x « x - sc(-1] 
|| (x - sc[-1]1) / base != y) 


{ 
errno = ERANGE; 
x = ULONG_MAX; 


} 
if (sign == '-') 
x = -Xi 
if (endptr) 
*endptr = (char *)sc; 


return (x); 
} 


/* atoi function */ 
#include <stdlib.h> 


int (atoi) (const char *s) 


{ 
return ((int)_Stoul(s, NULL, 10)) ; 
} 


/* atol function */ 
#include <stdlib.h> 


long (atol) (const char *s) 
{ 


return ((long)_Stoul(s, NULL, 10)); 


} 


/* strtoul function */ 
#include <stdlib.h> 


unsigned long (strtoul) (const char *s, 
{ /* convert string to unsigned long, with checking */ 
return (_Stoul(s, endptr, base)); 


} 


++sc) 


/* accumulate digits */ 
/* for overflow checking */ 


/* check string validity */ 


/* overflow */ 


/* get final value */ 


/* convert string to int */ 


口 


/* convert string to long */ 


口 


char **endptr, int base) 


口 
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图 13-16 
strtol.c 


/* strtol function */ 
#include «ctype.h» 
#include <errno.h> 
#include <limits.h> 
finclude <stdlib.h> 


long (strtol) (const char *s, char **endptr, int base) 

{ /* convert string to long, with checking */ 
const char *sc; 

unsigned long x; 


for (sc = s; isspace (*sc) ; ++sc) 
x = _Stoul(s, endptr, base) ; /* not sc! */ 
if (*sc == '-' && x <= LONG MAX) 

{ /* negative number overflowed */ 


errno = ERANGE; 
return (LONG_MIN) ; 
} 
else if (*sc !-'-' && LONG MAX < x) 
( /* positive number overflowed */ 
errno - ERANGE; 
return (LONG MAX) ; 


) 
else 
return ((long)x); 
) o 


图 13-17 /* atof function */ 
atof.c #include <stdlib.h> 


double (atof) (const char *s) 
{ /* convert string to double */ 
return (_Stod(s, NULL)); 
} D 


图 13-18 /* strtod function */ 
strtod.c #include «stdlib. h> 


double (strtod) (const char *s, char **endptr) 
{ /* convert string to double, with checking */ 
return ( Stod(s, endptr)); 
) 口 


注意 <stddef.h> 中 定义 的 很 少 使 用 的 类 型 ptrdiff CRUE T ont 
以 是 两 个 指针 之 间 的 有 符号 的 差 值 。 就 像 11.3 节 警 告 的 那样 ，Ptrdiff t ^^ 
是 一 个 完全 安全 的 类 型 。 有效 数字 大 于 32 767 的 参数 串 在 16 位 指针 的 计算 
机 上 可 能 不 会 报告 溢出 。 这 种 可 能 性 很 小 ， 但 它 还 是 会 发 生 的 。 而 且 ， 编 写 
完全 安全 的 测试 也 很 枯燥 沉闷。 这 里 我 选择 了 速度 而 不 是 绝对 安全 。 


atoi 
atol 
strtoul 


Å strtol 


atof 
strtod 


Å Stod 


函数 mbstowcs 
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图 13-13 到 图 13-15 显示 了 文件 atoi .c、atol.c 和 strtoul.c, ix tr 
件 都 定义 了 直接 调用 Stoul 的 函数 。 注 意 ，atoi 和 atol 可 能 溢出 ，C 标准 
对 这 样 的 溢出 报告 或 者 处 理 没 有 作 任何 要 求 。 


图 13-16 显示 了 文件 strtol.c。 它 定义 了 函数 strto1l， 这 个 函数 一 定 
会 正确 地 报告 溢出 。 因 此 ， 它 会 找 出 开头 的 所 有 负 号 ， 从 而 它 能 够 把 要 转换 
的 值 作为 long 类 型 来 检查 。 注 意 ， 这 个 函数 必须 用 原始 的 指针 调用 Stoul. 
WR _Stoul 找到 一 个 无 效 的 串 ， 它 一 定 要 把 那个 指针 存储 在 endptr H. Bk 
过 开头 的 任何 空白 都 可 能 会 造成 误导 。 

浮 点 数 转换 遵循 一 个 相似 的 模式 。 图 13-17 显示 了 文件 atof.c， 图 
13-18 显示 了 文件 strtod.c。 这 两 个 函数 都 只 是 调用 公共 函数 Stod 来 完成 
所 有 的 工作 。 在 这 种 情况 下 ，atof 要 进行 和 strtod 的 要 求 完全 相同 的 检查 。 


图 13-19 显示 了 文件 xstod.c。 它 定义 了 函数 _Stod， 这 个 函数 执行 了 
从 文本 串 到 编码 浮 点 数 的 所 有 转换 。 它 执行 得 非常 谨慎 ， 可 以 避免 中 间 数 洲 
出 和 精度 丢失 。 


例如 ， 宏 SIG MAX 表示 了 很 谨慎 的 折 中 。 它 把 有 效 值 的 位 数 限制 在 32 
位 。 这 对 这 个 实现 支持 的 最 精确 的 表示 来 说 已 经 很 多 了 (EEE 754 10 字 节 的 
long double 型 大 约 20 位 小 数 )。 它 也 远 远 达 不 到 和 和 它 一 致 的 实现 中 可 能 造成 
溢出 的 最 大 的 整数 〈 大 约 37 位 )。 这 个 函数 对 任何 指数 的 累加 也 很 谨慎 。 因 
此 ， 任 何 浮 点 数 的 上 洲 或 者 下 洲 都 被 "xmath.h" 中 声明 的 函数 _Dtento 安全 
处 理 了 。( 参 考 图 7-37 的 文件 sdtento.c, ) 


这 个 函数 的 前 半 部 分 检查 语法 并 累加 有 效 的 小 数位 。 然 后 ， 它 一 次 转换 
8 位 ， 转 换 为 一 个 long 型 的 数组 。 它 把 这 些 元 素 转 换 为 double 类 型 ， 从 最 少 
的 有 效 值 到 最 多 的 有 效 值 ， 并 且 在 把 它们 加 到 当前 的 总 和 之 前 进行 适当 的 比 
例 变换 。 这 个 操作 序列 的 效率 相当 高 而 且 能 保持 精度 。 


现在 让 我 们 看 看 多 字 节 函 数 。 图 13-21 显示 了 文件 mbtowc.c， 图 13-20 
显示 了 文件 mblen.c。mbtowc 和 mblen 都 调用 了 内 部 函数 Mbtowc 来 完 
成 实际 的 工作 。 每 一 个 函数 都 提供 了 <stdlib.h> 中 定义 的 -Mbsave 类 型 
的 单独 的 存储 空间 ， 用 来 记录 遍历 多 字 节 串 的 过 程 中 的 转移 状态 。 数 据 
对 象 Molen 和 _Mbxtowc 都 有 具有 外 部 连接 的 名 字 。 这 样 就 允许 头 文件 
<stdlib.h> 为 这 两 个 函数 定义 屏蔽 宏 。 原 则 上 ，mblen H mbtowc 简单 。 然 
而 ， 在 这 个 实现 中 ， 这 两 个 函数 必须 做 的 工作 几乎 没有 什么 差别 。 

图 13-22 显示 了 文件 mbstowcs.c. MA mbstowcs 重复 地 调用 _Mbtowc 
来 完成 整个 多 字 节 串 到 一 个 宽 字 节 字 符 串 的 转换 。 它 也 提供 了 Mosave 类 型 
的 存储 空间 ， 但 是 不 用 保留 两 个 调用 之 闻 的 转移 状态 。 
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% 13% <stdlib.h> 


图 13-19 


xstod.c 


/* Stod function */ 
#include <ctype.h> 

#include <float.h> 

#include <limits.h> 
#include <locale.h> 
#include <stdlib.h> 
#include "xmath.h" 


#define SIG MAX 32 


double  Stod(const char ze, char **endptr) 
H /* convert string to double, with checking */ 
const char point = localeconv()->decimal point [0]; 

const char *sc; 

char buf [SIG MAX], sign; 

double x; 


int ndigit, nsig, nzero, olead, opoint; 


for (sc = s; isspace(*sc); ++sc) 


i 


sign = *sc == '-' || *sc == '+' ? *sctt : '+'; 
olead = -1, opoint = -1; 
for (ndigit = 0, nsig = 0, nzero = 0; ; ++sc) 
if (*sc == point) 
if (0 <= opoint) 
break; /* already seen point */ 
else 


opoint = ndigit; 
else if (*sc == '0') 
++nzero, ++ndigit; 
else if (!isdigit(*sc)) 
break; 
else 
{ /* got a nonzero digit */ 
if (olead < 0) 
olead = nzero; 
else /* deliver zeros */ 
for (; 0 < nzero && nsig < SIG MAX; --nzero) 
buf[nsig++] = 0; 
++ndigit ; 
if (nsig < SIG MAX) /* deliver digit */ 
buf [nsig++] = *sc - '0'; 


if 


(ndigit 
( /* set endptr */ 
if (endptr) 

*endptr - (char *)s; 
return (0.0); 


for (; 0 < nsig && buf[nsig - 1] == 0; --nsig) 
; /* skip trailing digits 
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Æ 13-19 { /* compute significand */ 
GE) const char *pc = buf; 
int n; 


long lo[SIG MAX/8-41]; 
long *pl - &lo[nsig »» 3]; 
Static double fac[] = (0, 1e8, 1el6, 1e24, 1632); 


for (*pl = 0, n = nsig; 0 « n; --n) 
if ((n & 07) == 0) /* start new sum */ 
*--pl = *po++; 
else 


*pl = *pl* 10 + *po++; 
for (x = (double)lo[O], n = 0; ++n «- (nsig >> 3); ) 
if (lo[n] != 0) 
x += fac[n] * (double)lo[n]; 


) 

( a /* fold in any explicit exponent */ 
long lexp = 0; 
short sexp; 


if (*sc == 'e' || *sc == 'E') 
{ /* parse exponent */ 
const char *scsav = sc; 
const char esign = *++sc == '+' || *sc == '-' 
? *SCtt : '+'; 


if (!isdigit(*sc)) 


SC = scsav; /* ill-formed exponent */ 
else. 
{ /* exponent looks valid */ 
for (; isdigit(*sc) ; ++sc) 
if (lexp < 100000) ` /* else overflow */ 
lexp= lexp * 10 + *sc - "Dir: 
if (esign == '-') 
lexp - -lexp; 
) 


) 
if (endptr) 
*endptr = (char *) sc; 
if (opoint « 0) 
lexp += ndigit - nsig; 
else 
lexp += opoint - olead - nsig; 
Sexp - lexp « SHRT MIN ? SHRT MIN : lexp « SHRT MAX 
? (short)lexp : SHRT MAX; 
x = Dtento (x, sexp); 
return (sign == '-' ? -x : x); 


) 


} 
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13-20 | /* mblen function */ 
mblen.c |#include <stdlib.h> 


/* static data */ 
_Mbsave _Mbxlen = {0}; 


int (mblen) (const char *s, size_t n) 
{ /* determine length of next multibyte code */ 
return ( Mbtowc(NULL, s, n, & Mbxlen)); 


) D 


13-21 /* mbtowc function */ 
mbtowc.c #include <stdlib.h> 


/* static data */ 
_Mbsave _Mbxtowe = {0}; 


int (mbtowc) (wchar_t *pwc, const char *s, size t n) 
{ /* determine next multibyte code */ 
return ( Mbtowc(pwc, s, n, & Mbxtowc)); 


) [m 


图 13-22 /* mbstowcs function */ 
mbstowcs.c #include <stdlib.h> 


size_t (mbstowcs) (wchar t *wcs, const char *s, size t n) 
( /* translate multibyte string to wide char string */ 
int i; 
wchar, t *pwc; 
.Mbsave state - (0); 


for (pwc = wes; 0 < n; ++pwc, --n) 
{ /* make another wide character */ 
i = Mbtowcí(pwc, s, n, &state); 
if (i == -1) 
return (-1); 
else if (i == |! *pwc == 0) 
return (pwc - wcs); 
s+= i; 
) 
return (pwc - wcs); 
) 


函数 _Mbtowe 图 13-23 显示 了 文件 xmbtowc.c. ph BE _Mbtowc 对 一 个 多 字 节 序列 进 
行 充分 的 分 析 ， 以 此 来 确定 它 要 表示 的 下 一 个 宽 字 节 字 符 。 它 是 作为 一 个 
有 限 状 态 机 ， 来 完成 此 项 操作 的 ， 有 限 状态 机 执行 存储 在 Mostate Cx 
xstate.c 中 定义 ) 的 状态 表 。( 参 考 图 6-11.) 


_Mbtowc 一 定 要 特别 严密 ， 因 为 _Mbstate 可 能 会 有 缺陷 。 它 可 能 会 
着 区 域 设 置 类 别 LC_CTYPE 而 改变 ， 且 改变 方式 是 C 标准 库 无 法 控制 的 。 
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13-23 /* Mbtowc function */ 
xmbtowc.c #include «limits.h» 
#include <stdlib.h> 
#include "xstate.h" 


int _Mbtowc(wchar_t *pwe, const char *s, size_t nin, 
_Mbsave *ps) 
{ /* translate multibyte to widechar */ 
static const _Mbsave initial = {0}; 


if (s == NULL) 
{ /* set initial state */ 
*ps = initial; 
return ( Mbstate. Tab[0] [0] & ST STATE); 
H 
{ ` /* run finite state machine */ 
char state = ps-> State; 
int limit = 0; 
unsigned char *su (unsigned char *)s: 
unsigned short wc ps-» Wchar; 


if (MB CUR MAX < nin) 
nin = MB CUR MAX; 
for (; ; ) 
{ /* perform a state transformation */ 
unsigned short code; 
const unsigned short *stab; 


if (_NSTATE <= state 
li (stab = _Mbstate._Tab[state]) == NULL 
|! nin == 0 
ii (LNSTATE*UCHAR MAX) <= ++limit 
|| (code = stab[*su]) == 0) 
break; 
state = (code & ST STATE) >> ST STOFF; 
if (code & ST FOLD) 
wc = wc & -UCHAR MAX | code & ST CH; 
if (code & ST ROTATE) 
wc - wc »» CHAR BIT & UCHAR MAX | wc «« CHAR BIT; 
if (code & ST INPUT && *su !- 'N0') 
**su, --nin, limit = 0; 
if (code & ST OUTPUT) 
{ /* produce an output wchar */ 
if (pwc) 
wc = wc; 
ps-> State - state; 
ps-» Wchar = wc; 
return ((const char *)su - s); 
) 


) 
ps-> State = | NSTATE; /* error return */ 
return (-1); 
} 
} 
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EST wetomb 


函数 westombs 


函数 _Wetomb 


要 注意 函数 选择 错误 返回 的 原因 有 以 下 几 种 。 

如 果 转 移 到 一 个 未 定义 的 状态 。 

如 果 一 个 给 定 的 状态 没有 相应 的 状态 表 。 

如 果 一 个 多 字 节 串 在 一 个 多 字 节 字符 的 中 间 部 分 转换 结束 。 

如 果 函 数 生成 一 个 宽 字 节 字符 时 要 做 太 多 的 状态 转换 以 致 它 必 须 通 过 
循环 实现 。 

口 如 果 状 态 表 入 口 专门 报告 了 一 个 错误 。 

_Mbtowe 的 剩余 部 分 相 比 较 而 言 就 很 简单 了 。 函 数 保 留 宽 字 节 字符 累加 器 
(ps-» Wchar) 作为 状态 记录 的 一 部 分 。 这 样 就 使 得 在 一 个 给 定 的 转移 状态 
中 用 一 个 常用 的 组 成 部 分 生成 一 个 宽 字 节 字 符 序 列 变 得 更 简单 。_Mbtowc 在 
传送 每 一 个 宽 字 节 字符 之 后 返回 。 

图 13-24 显示 了 文件 wetomb.c。 函 数 wctomb 只 是 调用 内 部 函数 
_Wctomb 来 提供 独立 的 状态 记录 。 在 这 种 情况 下 ， 转 移 状 态 可 以 存储 在 一 个 
char 类 型 的 数据 对 象 中 。 数 据 对 象 Wextomb 有 一 个 具有 外 部 连接 的 名 字 ， 所 
以 头 文 件 <stdlib.h> 可 以 为 wctomb 定义 一 个 屏蔽 宏 。 

图 13-25 显示 了 文件 wocstombs.c, pK westombs 反复 地 调用 wctomb 
来 把 一 个 宽 字 节 字 符 串 转换 为 一 个 多 字 节 串 。 它 也 提供 了 自己 的 状态 记录 ， 
但 不 需要 记录 两 个 调用 之 间 的 转移 状态 。 

使 这 个 函数 变 得 复杂 的 是 它 写 入 的 char 数组 的 有 限 长 度 。 如 果 至 少 
可 以 剩余 MB CUR MAX 个 元 素 ， 那 么 _Wetomb 就 能 直接 传送 字符 。 和 否则 ， 
westombs 必须 把 生成 的 字符 存储 在 一 个 长 度 为 MB_CUR_MAX 的 数组 中 ， 并 且 
传送 尽 可 能 多 的 字符 。 

图 13-26 显示 了 文件 xwctomb.c。 函 数 _Wctomb 用 来 把 一 个 宽 字 节 字符 
转换 为 组 成 它 的 多 字 节 表示 的 一 个 或 者 多 个 字符 。 它 是 作为 一 个 有 限 状态 机 
来 完成 这 项 操作 的 ， 该 有 限 状 态 机 执行 存储 在 _Westate (在 文件 xstate.c 
中 定义 ) 中 的 状态 表 。( 参 考 图 6-11.。) 

_Wetomb 一 定 要 非常 严密 ， 因 为 _Wcstate 也 可 能 会 有 缺陷 。 它 可 能 会 
随 着 区 域 设置 类 别 Lc CTYPE 而 改变 ， 且 改变 方式 是 C 标准 库 无 法 控制 的 。 
注意 函数 选择 错误 返回 的 原因 有 以 下 几 种 。 

口 如 果 转 移 到 一 个 未 定义 的 状态 。 

D 如 果 一 个 给 定 的 状态 没有 相应 的 状态 表 。 

C) 如 果 生 成 的 多 字 节 串 可 能 会 变 得 比 MB_CUR_MAX 个 字符 还 长 。 

C) 如 果 函 数 生成 一 个 宽 字 节 字符 时 要 做 太 多 的 状态 转换 以 致 它 必须 通 

过 循环 实现 。 

口 如 果 状 态 表 入 口 专门 报告 了 一 个 错误 。 

相 比 之 下 ，_Wctomb 的 剩余 部 分 也 同样 简单 。 它 在 处 理 完 每 一 个 宽 字 节 字 符 
输入 之 后 返回 。 
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Æ 13-24 
wctomb.c 


图 13-25 


wcstombs.c 
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/* wctomb function */ 
#include <stdlib.h> 


/* static data */ 
char Wcxtomb = {0}; 


int (wctomb) (char *s, wchar_t wchar) 
t /* translate wide character to multibyte string */ 
return ( Wctomb(s , wchar, & Wcxtomb)); 


) m 


/* wcstombs function */ 
#include <limits.h> 
tinclude <string.h> 
finclude <stdlib.h> 


size t (wcstombs) (char *s, const wchar t *wcs, size t n) 
{ /* translate wide char string to multibyte string */ 


char *sc; 
char state = {0}; 
size_t i; 


for (sc =s;0<n; -= i, ++WCs) 
{ /* translate another wide character */ 
if (MB CUR MAX <= n) 
( /* copy directly */ 
if (( i = Wctomb(sc, *wcs, &state)) <= 0) 
return (-1); 


/* copy into local buffer */ 
char buf [MB LEN MAX]; 


if ((i = _Wctomb (buf, *wcs, &state)) <= 0) 
return (-1); 
else if (i <= n) 
memcpy(sc, buf, i 
eise 
( /* won't all fit */ 
memcpy(sc, buf, n): 
return (sc - S + n); 
} 
} 
sc += i; 
if (sc[-1] == '\0') 
return (sc - s - 1); 
} 
return (sc - s); 


} 
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一 a 


图 13-26 
xwctomb.c 


/* Wetomb function */ 
#include <limits.h> 
#include <stdlib.h> 
#include "xstate.h" 


int _Wetomb (char zs, wchar t wcin 


{ 

static const char initial = 
if (s == NULL) 

{ 

*ps initial; 

return ( Mbstate. Tab[0] 
} 


{ 
char state *ps; 
int leave = 0; 
int limit 0; 
int nout 0; 
unsigned short wc 


wcin; 
for (; ; ) 
{ 


unsigned short code; 


, Char *ps) 
/* translate widechar to multibyte */ 
{0}; 


/* set initial state Wi 


[0] & ST STATE); 


/* run finite state machine */ 


/* perform a state transformation */ 


const unsigned short *stab; 


if ( NSTATE <= 
li (stab 
HI 
HI 
|| (code 
break; 
state 
if (code 
wc 
(code 
WC 
(code 
{ 
if 


state 
.Wcstate. 


& ST FOLD) 


if & ST ROTATE) 
wc >> CHAR BIT 


& ST OUTPUT) 


if 


((s[nout++] 
leave 1; 
limit = 0; 

} 

(code & ST_INPUT 
{ 

*ps state; 
return (nout); 
} 


if N 


} 
*ps = _NSTATE; 
return (-1); 
} 
} 


_Tab[state] } 
MB_CUR_MAX <= nout 
(_NSTATE*UCHAR_MAX) <= ++limit 
stab[wc & UCHAR MAX]) 


(code & ST STATE) 


Code & ST CH ? code 


NULL 


>> ST STOFF; 


wc & -UCHAR MAX | code & ST CH; 


& UCHAR MAX | wc «« CHAR BIT; 


/* produce an output char */ 
wc) 'NO?) 


leave) 


/* consume input */ 


图 13-27 


xalloc.h 


存储 分 配 


头 文件 


"xalloc.h" 


宏 CELL OFF 


存储 空间 边界 
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/* xalloc.h internal header */ 
#include «stddef.h» 

#include <stdlib.h> 

#ifndef _YVALS 

#include <yvals.h> 

#endif 


/* macros */ 
#define CELL_OFF (sizeof (size_t) + _MEMBND & ~_MEMBND) 
#define SIZE_BLOCK 512 /* minimum block size */ 
#define SIZE_CELL \ 
((sizeof ( Cell) + _MEMBND & ~_MEMBND) - CELL OFF) 


/* type definitions */ 
typedef struct Cell ( 
size t Size; 
struct Cell * Next; 
) Cell; 
typedef struct ( 
.Cell ** Plast; 
.Cell * Head; 
) _Altab; 
/* declarations */ 
void * Getmem(size t); 
extern Altab  Aldata; 


在 程序 的 执行 过 程 中 ， 几 个 函数 合作 来 完成 空间 的 分 配 和 释放 。 这 些 函 
数 有 很 多 实现 方法 。 我 选择 将 可 用 空间 池 CH”) 作为 一 个 单 链表 来 维护 ， 
链表 元 素 仍 是 按照 它们 在 存储 空间 中 的 地 址 排列 的 ， 一 个 静态 的 指针 指向 表 
的 表 头 一 一 最 低地 址 的 元 素 。 


图 13-27 显示 了 文件 xalloc.h， 它 是 一 个 被 所 有 的 空间 分 配 函 数 包 含 
的 内 部 头 文件 。 该 文件 定义 了 一 些 宏 和 类 型 。 例 如 ， 一 个 表 的 元 素 类 型 为 
_Cel1。 至 少 该 表 要 以 这 样 的 一 个 数据 对 象 开头 。 成 员 size 以 字 节 为 单 
位 给 出 了 整个 元 素 的 大 小 ， 它 一 般 比 一 个 Ce 数据 对 象 要 大 得 多 。 成 员 
_Next 指向 可 用 存储 表 的 下 一 个 元 素 。 


一 个 已 经 分 配 的 元 素 仍 以 成 员 size 开头 。 后 面 程序 想 要 释放 这 个 已 经 
分 配 的 元 素 时 ， 可 能 会 用 到 该 信息 。 然 而 ， 程 序 看 不 到 这 个 有 关 大 小 的 信息 。 
分 配 函 数 返 回 一 个 指向 成 员 _Size 之 外 的 可 用 空间 的 指针 。 宏 CELL OFF 给 
出 从 已 经 分 配 的 元 素 的 起 始 位 置 开 始 的 可 用 区 域 偏 移 量 〈 以 字 节 为 单位 )。 


很 多 计算 机 体系 结构 都 很 关心 存储 空间 边界 。 一 些 〈 体 系 结构 ) 要 求 某 
些 类 型 的 数据 对 象 在 字 节 的 某 些 倍数 的 地 址 开始 存储 。 典 型 的 倍数 是 2、4 
或 者 8 倍 。 其 他 的 计算 机 体系 结构 没有 要 求 这 样 的 对 齐 ， 但 是 当 对 适当 对 齐 
了 的 数据 对 和 象 进 行 操作 时 执行 得 更 快 。<stGarg.h> 中 定义 的 宏一 定 要 更 正 由 
于 参数 数据 对 象 的 对 齐 而 留 下 的 空 除 。( 参 考 第 10 章 。) 
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JE MEMBND 


CELL OFF 
SIZE CELL 


Å malloc 


数据 对 象 


_Aldata 


% SIZE BLOCK 


存储 分 配 函 数 也 受 存 储 空间 边界 的 影响 。 它 们 认为 存在 最 坏 情 况 的 存 
储 空间 边界 ， 因 此 任何 在 这 个 边界 对 齐 的 数据 对 象 能 适当 对 齐 。 内 部 头 文件 
<yvals.h> 定义 了 宏 _MEMBND 来 指定 这 种 最 坏 情况 的 存储 空间 边界 。 对 于 一 
个 2” 的 边界 来 说 ， 这 个 宏 的 值 为 2”'。 例 如 ， 在 Intel 80X86 计算 机 上 ， 这 个 
值 可 以 是 零 ( 没 有 任何 限制 )。 也 许 它 应 该 至 少 为 1 (2 字 节 边界 )。 对 这 样 
的 一 个 具有 32 位 内 存 的 计算 机 ， 用 户 可 能 会 希望 让 它 为 3(4 字 节 边界 )。 

存储 空间 分 配 函 数 的 很 多 难以 理解 的 逻辑 都 源 于 对 最 坏 情 况 的 存储 空间 
边界 进行 参数 化 的 尝试 。 宏 CELL_OFF 假设 一 个 表 元 素 从 最 坏 情况 的 存储 边 
界 开始 。 它 确定 了 作为 下 一 个 这 样 的 边界 的 可 用 空间 的 起 始 位 置 ， 这 个 边界 
在 为 成 员 Size 留 出 的 空间 之 外 。 同 样 ， 宏 SIZE CELL 为 一 个 表 元 素 生成 一 
^* Size 的 最 小 允许 值 。 这 个 表 元 素 要 足够 大 来 存储 一 个 Cell 数据 对 象 。 
它 也 必须 以 一 个 最 坏 情况 的 存储 空间 边界 结束 。 

和 函数 malloc 一 样 ，"xalloc.h" 的 剩余 部 分 也 可 以 得 到 最 好 的 解释 。 
图 13-28 显示 了 文件 malloc.c. MR malloc 为 size 字 节 的 数据 对 象 分 配 空 
间 。 为 了 实现 这 个 功能 ， 它 从 具有 可 用 存储 空间 的 表 中 寻找 一 个 至 少 有 size 
字 节 可 用 区 域 的 元 素 。 如 果 找 到 了 一 个 ， 它 就 把 超过 的 足以 生成 另 一 个 表 元 
素 的 部 分 分 离 出 来 。 它 返回 一 个 指向 可 用 空间 的 指针 。 

malloc.c 中 定义 的 内 部 函数 findmem 对 可 用 空间 表 进 行 扫描 。 它 在 
_Altab 类 型 ("xstdio.h" 中 定义 ) 的 数据 对 象 Aldata 中 保留 两 个 静 
态 指针 。 . 

O Head 指向 表 的 表 头 。 如 果 表 为 空 ， 它 就 包含 一 个 空 指针 。 

口 Plast 是 指向 下 一 个 要 考虑 的 表 元 素 的 指针 的 地 址 。 它 可 以 指向 

 Aldata. Head 或 者 一 个 可 用 的 表 元 素 的 _Next， 或 者 它 也 可 以 是 一 


pete 
个 空 指针 。 


在 任何 可 能 的 时 候 ，findmem 都 在 它 上 一 次 停止 调用 的 地 方 开始 扫描 。 这 种 
策略 通过 分 配 整 个 表 的 使 用 来 减少 了 表 头 部 分 的 碎片 。malloc 本 身 和 函数 
free 相互 协作 来 维护 这 两 个 指针 。 

如 果 findmem 不 能 在 可 用 表 中 找到 一 个 适当 的 元 素 ， 那 么 它 就 尝试 获 
得 更 多 的 存储 空间 。( 最 初 堆 为 室 ， 所 以 开始 的 时 候 要 做 这 一 步 。) 它 调用 
"xalloc.h" 中 声明 的 函数 _Getmem 来 完成 这 样 的 工作 。 那 个 基本 函数 一 定 
要 返回 一 个 指向 至 少 为 要 求 的 大 小 的 存储 空间 的 指针 ， 该 存储 空间 在 最 坏 情 
况 的 存储 边界 对 齐 。 如 果 不 能 ， 就 返回 一 个 空 指针 。 

"xalloc.h" 中 定义 的 宏 SIZE_BLOCK 确定 了 最 小 的 首选 的 表 元 素 大 
小 。 我 把 它 设 为 S12， 但 可 以 修改 。findmem 首 先 请 求 使 用 要 求 的 大 小 和 
SIZE BLOCK 中 较 大 的 一 个 。 如 果 失 败 ， 它 就 反复 地 将 请 求 的 大 小 减 半 ， 直 到 


函数  Getmem 


函数 calloc 


函数 free 
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请 求 被 满足 或 者 对 要 求 的 大 小 的 请 求 不 能 实现 。 这 种 策略 更 喜欢 较 大 的 元 素 
大 小 ， 但 是 最 后 采用 它 能 够 得 到 的 大 小 。 如 果 请 求 被 满足 了 ，finGmem 就 让 
新 的 存储 空间 看 起 来 像 一 个 之 前 分 配 的 元 素 。 它 调用 free 把 空间 添加 到 可 
用 表 中 。 下 一 次 执行 扫描 循环 时 应 该 会 发 现 这 个 空间 并 且 使 用 它 。 

函数 Getmem 很 大 程度 上 依赖 执行 环境 。 在 每 一 个 操作 系统 下 都 必须 大 范 
围 地 修改 这 个 原 语 。 为 了 完整 ， 这 里 我 给 出 了 UNIX 下 运行 的 _Getmem 版 本 。 
实现 头 文件 <stdio.h> 的 几 个 原 语 时 ， 我 也 是 这 样 做 的 。( 参 考 12.4 节 。) 

图 13-29 显示 了 文件 xgetmem.c。 作 为 早期 的 UNIX 原 语 ， 它 假设 存在 
一 个 名 字 可 以 改变 为 保留 形式 的 C 可 调用 系统 服务 。_Sbrk 执行 分 配 存储 空 
间 块 的 UNIX 系统 服务 sbrk。 注 意 ，_Sbrk 期 望 得 到 一 个 int 类 型 的 参数 。 
因此 ，_Getmenm 必须 保证 一 个 非常 大 的 请 求 可 以 被 正确 解释 。 

图 13-30 显示 了 文件 calloc.c。 它 调用 malloc 来 分 配 存储 空间 ， 然 后 
把 它 自己 的 字符 设 为 零 。 一 个 更 严密 的 版 本 可 能 会 检查 那 两 个 参数 的 乘积 大 
小 是 否 适 当 。 

图 13-31 显示 了 文件 free.c。 它 释放 前 面 由 malloc 或 者 realloc 分 配 
的 空间 。 有 两 个 常见 的 编程 错误 会 对 free ARM: 

O 无 效 的 存储 会 改变 成 员 Size 的 值 ; 

D 一 个 程序 用 一 个 无 效 的 指针 调用 free。 这 种 情况 说 明 数 据 对 象 从 来 

没有 被 分 配 或 者 它 已 经 被 释放 了 。 

也 许 任何 数量 的 检查 都 不 能 阻止 有 缺陷 的 程序 破坏 free。 这 个 版 本 只 
作 了 一 次 或 者 两 次 粗略 的 检查 。 如 果 Size 成 员 不 是 最 坏 情 况 存储 边界 的 倍 
数 ， 说 明 它 已 经 被 修改 了 或 者 从 来 没有 被 分 配 。 如 果 要 释放 的 元 素 和 可 用 空 
间 表 中 的 某 个 存在 的 元 素 重 着 了， 那么 它 被 释放 了 两 次 。 这 两 种 错误 都 会 导 
致 free 返回 而 不 去 释放 指定 的 存储 空间 。 一 个 更 好 的 版 本 可 能 会 报告 一 个 
信和 号 或 者 生成 一 个 诊断 。 至 少 ， 它 可 能 会 在 <errno.h> 声明 的 errno 中 存储 
一 个 非 零 值 。 

free 的 大 部 分 工作 是 在 可 用 空间 表 中 寻找 适当 的 地 方 来 插入 释放 的 元 
素 。 如 果 释 放 的 元 素 和 一 个 或 者 两 个 存在 的 表 元 素 相 邻接 ， 这 些 邻 接 的 元 素 
就 会 组 合 在 一 起 。 这 样 就 可 以 使 表 的 碎片 减少 。 

注意 ，free 修改 了 扫描 指针 _Aldata._Plast。 这 是 很 必要 的 ， 因 为 存 
储 的 指针 可 能 会 指向 一 个 已 经 和 另 一 个 元 素 合 并 的 元 素 。 我 选择 从 释放 的 
元 素 处 开始 扫描 。 这 里 是 一 个 很 容易 确定 的 地 址 。 这 种 方法 也 可 以 更 统一 地 
使 用 表 中 的 存储 空间 ， 并 且 它 尽 可 能 地 推迟 重新 利用 释放 的 存储 空间 的 时 间 
(对 有 漏洞 的 程序 的 关照 ， 值 得 推荐 )。 另 一 方面 ， 任 何 通 过 调用 _Getmem 使 
堆 增 长 的 时 候 ， 都 会 降低 它 的 效率 。 这 是 一 个 值得 探索 的 领域 。 
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一 一 一 一” LLL 


13-28 /* malloc function */ 
malloc.c #include "xalloc.h" 
finclude "yfuns.h" 


/* static data */ 
.Altab | Aldata = {0}; /* heap initially empty 


Static Cell **findmem(size t size) 
{ /* find storage 


Cell zo, **qb; 


for (; ; ) 
{ ! /* check freed space first 
if ((qb = Aldata. Plast) == NULL) 
{ /* take it from the top 
for (qb = &_Aldata._Head; *qb; 
qb = &(*qb)->_Next) 
if (size <= (*qb)-> Size) 
return (qb); 
) 


else 
{ /* resume where we left off 


for (; *qb; gb = &(*qb)-» Next) 
if (size <= (*qb)->_size) 
return (qb); 
q = * Aldata. Plast; 
for (qb = & Aldata. Head; *qb != q; 
ab = &(*qb)-» Next) 
if (size <= (*qb)-> Size) 
return (qb) ; 


{ /* try to buy more space */ 


size_t bs; 
const size_t sz = size + CELL_OFF; 


for (bs = SIZE BLOCK; ; bs >>= 1) 
t /* try larger blocks first */ 
if (bs « sz) 
bs = sz; 
if ((q = _Getmem(bs)) ! = NULL) 
break; 
else if (bs == sz) 
return (NULL); /* no storage */ 
} 
/* got storage: add to heap and retry */ 
q->_Size = (bs & ~_MEMBND) - CELL_OFF; 
free((char *)q + CELL OFF); 
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Pel 13-28 void * (malloc) (size t size) | 
( 续 ) { /* allocate a data object on the heap */ 
Cell *q, **qb; 
if (size < SIZE CELL) /* round up size */ 
size = SIZE CELL; 
size = (size +  MEMBND) & - MEMBND; 
if ((qb = findmem(size)) == NULL) 
return (NULL); 
q *qb; 
if (q->_Size < size + CELL OFF + SIZE CELL) 
*qb = q-» Next; /* use entire cell */ 
else 
{ /* peel off a residual cell */ 
*qb = ( Cell *)((char *)q 
+ CELL_OFF + size); 
(*qb) ->_Next = q->_Next; 
(*qb) ->_Size = q-> Size - CELL OFF - size; 
q->_Size = size; 
} 
 Aldata. Plast = qb ? qb : NULL; /* resume here */ 
return ((char *)q + CELL OFF); 
H D 
图 13-29 /*  Getmem function -- UNIX version */ 


xgetmem.c finclude "xalloc.h" 


/* UNIX system call */ 
void * Sbrk(int); 


void * Getmem (size t size) 
( /* allocate raw storage */ 
void *p; 
int isize - size; 
return (isize «- 0 (void *)-1 
? NULL : p): 


(p 


图 13-30 /* calloc function */ 
#include <stdlib.h> 
#include <string.h> 


calloc.c 


void *(calloc)(size t nelem, size t size) 
{ /* allocate a data object on the heap and clear it */ 
const size_t n = nelem * size; 
char *p = malloc(n); 


if (p) 
memset (p, '\0', n); 
return (p); 
) 口 


* <stdlib.h> 


/* free function */ 
finclude "xalloc.h" 


void (free)(void *ptr) 
{ /* free an allocated data object 


_Cell *q; 


if (ptr == NULL) 


return; 
q = (Cell *)((char *)ptr - CELL OFF) ; 
if (q-» Size &  MEMBND) 
return; /*bad pointer 


if ( Aldata. Head == NULL 
{| q < Aldata. Head) 
{ /* insert at head of list 
g->_Next = _Aldata._Head; 
_Aldata._Head = q; 
} 
else 
{ /* scan for insertion point 
_Cell *qp; 
char *qpp; 


for (ap = _Aldata._Head; 

qp->_Next && q < qp->_Next;) 

ap = qp->_Next; 
app = (char *)qp + CELL OFF + ap-> 5ize; 
if ((char *)q < app) 


return; /* erroneous call 
else if ((char *)q == app) 

{ /* merge ap and q 

qp-» Size += CELL OFF + q-») Size; 

q = Op: 

} 
else 

H /* splice q after ap 


q-». Next = qp-» Next; 
qp-» Next = q; 
) 
} 
if (q->_Next && 
(char *)q + CELL OFF + q->_Size == (char *)q-> Next) 
{ /* merge q and q->_Next 
q->_Size += CELL_OFF + q->_Next->_Size; 
q-», Next = q-> Next-> Next; 
} 
 Aldata. Plast = &q->_Next; /* resume scan after freed 


} 


*/ 


*/ 


*/ 


*/ 


*/ 


*/ 


*/ 


*/ 
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图 13-32 


realloc.c 


Å realloc 


/* realloc function */ 
finclude <string.h> 
#include "xalloc.h" 


void * (realloc) (void *ptr, size t size) 
/* reallocate a data object on the heap 


Cell *q; 


if (ptr == NULL) 
return (malloc(size)); 

q- (Cell *)((char *)ptr - CELL OFF) ; 

if (q-> Size < size) 
( /* try to buy a larger cell 
char *const new p - malloc (size); 


if (new p -- NULL) 
return (NULL) ; 

memcpy (new p, ptr, q-» Size); 

free (ptr); 

return (new p): 

) 
else if (q-» Size 

< size + CELL OFF + SIZE CELL) 

return (ptr); /* leave cell alone 
else 

{ /* free excess space 

const size_t new_n = (size + _MEMBND) & ~_MEMBND; 

Cell *const new q = ( Cell *)((char *)ptr + new n); 


new q-» Size - q-» Size - CELL OFF - new n; 
q-»-» Size = new n; 

free((char *) new q + CELL OFF) ; 

return (ptr): 


) 


图 13-32 显示 了 文件 realloc.c。 如 果 可 能 的 话 ， 函 数 realloc 会 尽力 
分 配 一 个 更 大 的 存储 空间 。 如 果 值得 整理 已 经 存在 存储 空间 ， 它 也 会 尽力 去 
整理 。 


这 个 版 本 并 没有 尽 最 大 的 努力 去 工作 。 如 果 要 求 了 一 个 更 大 的 存储 空 
间 ， 这 个 函数 坚持 在 释放 已 经 存在 的 空间 之 前 分 配 一 个 新 的 空间 。 这 样 就 不 
必 担 心 在 重新 安排 过 程 中 保留 存储 在 可 用 空间 中 的 数据 。 但 是 它 排除 了 一 种 
可 能 性 一 一 更 大 的 空间 只 有 当 已 经 存在 的 空间 释放 之 后 才 可 能 使 用 。 所 以 这 
里 为 一 个 优秀 的 实现 人 员 保 留 了 可 供 改 进 的 地 方 。 


存储 分 本 函数 非常 重要 ， 很 多 程序 依靠 它们 来 快速 并 且 健 壮 地 工作 。 它 
们 对 调试 也 能 提供 很 有 价值 的 帮助 。 因 为 它们 非常 独立 ， 所 以 它们 很 容易 作 
为 一 个 独立 的 单元 来 修改 。 由 于 以 上 这 些 原 因 ， 这 些 函 数 的 实现 有 很 多 种 。 
这 里 我 强调 了 性 能 和 健壮 性 。 当 然 ， 实 现 者 也 可 能 想 专注 于 其 他 的 目标 。 
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abort 
atexit 


exit 


函数 Exit ` 


函数 getenv 


函数 system 


最 后 一 组 函数 通过 各 种 各 样 的 方式 和 环境 交互 。 其 中 3 个 函数 处 理 程序 
终止 一 一 abort、atexit 和 exit。 图 13-33 到 图 13-35 显示 了 文件 abort.c, 
atexit.c 和 exit.c, abort 只 是 简单 地 报告 信号 SIGABRT。 如 果 这 个 信号 
的 处 理 程 序 返 回 ， 那 么 函数 就 以 失败 的 状态 退出 。atexit 几乎 同样 简单 ， 它 
只 是 把 一 个 函数 指针 推 入 一 个 由 数据 对 象 Account 和 Atfuns 定义 的 栈 中 。 
对 exit 的 调用 就 是 使 这 个 栈 的 栈 顶 元 素 出 栈 并 且 调 用 相应 的 函数 。 


exit 也 在 它 终 止 程序 的 执行 之 前 关闭 所 有 打开 的 文件 。 程 序 的 终止 方式 
依赖 于 系统 。 然 而 ， 通 常 可 以 调用 某 个 函数 来 完成 这 些 工 作 。 和 其 他 几 个 接 
口 原 语 一 起 ， 我 把 这 个 问题 放 进 了 内 部 头 文 件 "yfuns.h" 中 。 它 或 者 声明 -- 
个 函数 ， 或 者 定义 一 个 叫做 Exit 的 宏 ， 该 宏 接 受 退 出 状态 并 且 终 止 程序 的 
执行 。 例 如 ， 在 UNIX 系统 下 ，_Exit 只 是 exit 系统 服务 的 一 个 可 更 改 的 名 
EG 


图 13-36 显示 了 文件 getenv.c。 它 一 定 知道 怎样 访问 定义 了 所 有 的 环境 
变量 的 环境 表 ， 它 也 一 定 知道 怎样 遍历 那个 表 来 扫描 上 共有 要 求 的 名 字 的 环境 
变量 。 我 在 这 里 给 出 的 版 本 在 UNIX 下 工作 。 它 也 可 以 在 很 多 其 他 的 操作 系 
统 下 工作 。 


getenv 假设 _Envp 指向 一 个 以 空 字符 结束 的 字符 串 的 序列 的 第 一 个 字 
符 串 。 这 个 序列 以 一 个 空 字 符 串 结束 。 这 个 序列 中 的 每 一 个 串 的 形式 都 为 
name = value。 如 果 参 数 串 和 等 号 前 面 的 所 有 的 字符 匹配 ， 那 么 函数 返回 一 
个 指向 等 号 后 面 的 第 一 个 字符 的 指针 。 我 再 一 次 把 定义 或 者 声明 _Envp 的 工 
作 留 给 了 内 部 头 文件 "yfuns.h"。 


有 些 操作 系统 支持 环境 表 ， 但 不 是 这 种 形式 的 。 其 他 系统 支持 的 环境 表 
作为 一 个 C 数据 对 象 不 是 直接 可 寻 址 的 。 这 两 种 情况 都 要 求 把 字符 串 的 值 复 
制 到 一 个 getenv 私有 的 静态 缓冲 区 中 。 要 这 样 做 就 必须 修改 这 个 实现 中 的 几 
个 函数 。 这 几 个 函数 假设 它们 可 以 直接 调用 getenv。 只 有 在 调用 对 用 户 程序 
没有 影响 的 情况 下 这 种 假设 才 成 立 。 必 须 引 人 一 个 像 Getenv 这 样 让 用 户 提 
供 自 己 的 静态 缓冲 区 的 函数 来 保存 这 个 串 的 值 。 我 选择 省 略 阻止 进一步 修改 
的 那 一 层 。 

图 13-37 显示 了 文件 system.c. CRT ft system 的 UNIX 版 本 可 
能 会 从 一 个 C 程序 中 调用 一 个 命令 处 理 程序 的 方法 。 和 往常 一 样 ， 这 个 函数 
假设 存在 几 个 具有 合适 的 保留 名 字 的 UNIX 系统 服务 。 而 且 和 往常 一 样 ， 我 
在 这 里 给 出 的 版 本 可 以 改进 。 把 路 径 名 "/bin/sh" 作为 命令 处 理 程序 的 名 字 
是 最 理想 的 情况 ， 也 是 最 不 好 的 习惯 。 通 常 使 用 几 种 更 成 熟 的 方案 来 对 指定 
各 种 命令 处 理 程序 。 这 个 晴 数 也 能 返回 程序 关注 的 更 有 用 的 状态 信息 。 


图 13-33 
abort.c 


图 13-34 
atexit.c 


图 13-35 


exit.c 
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/* abort function '*/ 
#include <stdlib.h> 
#include <signal.h> 


void (abort) (void) 
{ /* terminate abruptly */ 
raise (SIGABRT) ; 
exit (EXIT_FAILURE) ; 
} 


/* atexit function */ 
#include <stdlib.h> 


/* external declarations */ 
extern void (*_Atfuns[]) (void); 
extern size_t _Atcount; 


int (atexit) (void (*func) (void) ) 
{ C /* function to call at exit */ 
if ( Atcount == 0) 
return (-1); 
.Atfuns[-- Atcount] - func; 
return (0); 


) 


/* list is full */ 


/* exit function */ 
finclude <stdio.h> 
#include <stdlib.h> 
#include "yfuns.h" 


/* macros */ 
#define NATS 32 

/* static data */ 
void (* Atfuns[NATS]) (void) = (0); 
size_t _Atcount = {NATS); 


void (exit) (int status) 
{ /* tidy up and exit to system */ 
while (_Atcount < NATS) 
(*_Atfuns[_Atcount++])() ; 
{ /* close all files */ 


size_t i; 


for ( i = 0; i < FOPEN MAX; ++i) 
if ( Files[i]) 
fclose(_Files[i]); 


} 


_Exit (status); 
} 
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Æ 13-36 


/* getenv function -- in-memory version */ 
getenv.c finclude <stdlib.h> 
include <string.h> 
#include "yfuns.h" 
char *(getenv) (const char *name) 
H /* search environment list for named entry */ 
const char *s; 
Size t n - strlen(name); 
for (s - Envp; *a; S += strlen(s) + 1) 
{ /* look for name match */ 
if (!strnemp(s, name, n) && s[n] == '=") 
return ((char *)&s[n + 1]); 
} 
return (NULL); 
} o 
图 13-37 /* system function -- UNIX version */ 
system.c finclude <stdlib.h> 


/* UNIX system calls */ 
int Execl(const char *, const char *, Ja); 
int _Fork(void); 
int Wait (int *); 


int (system) (const char *s) 


H /* send text to system command line processor */ 
if (s) 
{ /* not just a test */ 
int pid = _Fork(); 


if (pid < 0) 
; /* fork failed */ 
else if (pid == 0) 
i /* continue here as child */ 
.Execl("/bin/sh", "sh", "-C", s, NULL); 
exit (EXIT FAILURE); 
) 
else /* continue here as parent */ 
while ( Wait(NULL) ! = pid) 
; /* wait for child */ D 
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13.5 <stdlib.h> 的 测试 


图 13-38 显示 了 文件 tstalib.c。 这 个 程序 对 <stdlib.h> 中 声明 的 
各 种 各 样 的 函数 进行 测试 ， 虽 然 有 时 候 很 粗略 。 例 如 ， 函 数 getenv 和 
system 可 以 返回 任何 值 并 能 满足 这 个 测试 。 剩 余 的 函数 必须 至 少 做 -- 些 有 
用 的 事 。 


作为 结果 ， 程 序 显示 了 宏 RAND MAX 和 MB CUR MAX 的 值 。 它 也 确定 了 
"C 区 域 设 置 是 否 支 持 具 有 转移 状态 的 多 字 节 串 。 对 本 书 的 实现 ， 这 个 程序 
显示 下 面 的 内 容 : 


为 了 显示 最 后 一 行 并 成 功 地 退出 ， 程 序 必须 完成 几 件 正确 的 事情 。 它 必 
须 提供 可 以 触发 调用 abort 的 SIGABRT 信号 的 处 理 程序 。 这 个 处 理 程序 必须 
用 成 功 的 状态 EXIT SUCCESS 调用 exit. Jf H exit 必须 调用 函数 atexit 注 
册 的 处 理 程 序 done。 该 处 理 程 序 必须 能 向 标准 输出 流 写 入 一 行文 本 。 所 有 这 
些 都 在 测试 有 关 处 理 程序 终止 的 逻辑 。 


13.6 ”参考 文献 


Donald Knuth, The Art of Computer Programming, Vols. 1-3 (Reading, Mass.: 
Addison-Wesley, 1967 and later). 这 里 有 丰富 的 算法 资源 ， 并 带 有 完全 的 分 
析 和 入 门 指 南 。 第 一 卷 是 Fundamental Algorithms, $ Xk Je Semimumerical 
Algorithms, $ =X Æ Sorting and Searching。 有 些 现 在 已 经 出 第 二 版 了 。 


书 中 的 信息 包括 : 


维护 一 个 堆 ; 

计算 随机 数 ; 

搜索 有 序 序列 ; 

排序 ; 

在 不 同 的 数 制 之 间 转 换 。 

在 修改 本 章 中 的 代码 之 前 ， 可 以 参考 一 下 Knuth 的 观点 。 

Ronald F. Brender, Character Set Issues for Ada 9X, SEI-89-SR-17 (Pittsburgh,Pa.: 
Software Engineering Institute, Carnegie Mellon University, October 1989). 这 是 
对 程序 设计 语言 中 关于 大 字符 集 和 多 字 节 字符 集 的 很 多 问题 的 优秀 总 结 。 虽 
然 这 些 文档 以 Ada 程序 设计 语言 为 中 心 ， 但 它 与 C 的 相关 性 也 非常 大 。 


DOOOO 


380 


第 13 章 


<stdlib.h> 


图 13-38 ` 
tstdlib.c 


/* test stdlib functions */ 


|*include «assert.h» 


#include «limits.h» 
finclude «signal.h» 
#include <stdio.h> 

#include <stdlib.h> 
#include <string.h> 


static void abrt (int sig) 
{ /* handle SIGABRT 
exit (EXIT SUCCESS); 
} 


static int cmp(const void *pl, const void *p2) 
H /* compare function for bsearch and qsort 
unsigned char c1 *(unsigned char *)p1; 
unsigned char c2 - *(unsigned char *)p2; 


return (*(unsigned char *)pl - *(unsigned char *)p2); 
} 


static void done (void) 
{ /* get control from atexit 
puts ("SUCCESS testing <stdlib.h>"); 
} 


int main () 
{ /* test basic workings of stdlib functions 
char buf [10], *sl, *s2; ` 
div t igr; 
ldiv t lar; 
int il - EXIT FAILURE; 
int i2 - EXIT SUCCESS; 
int i3 - MB CUR MAX; 
wchar t wcs[10]; 
static char abc [] = "'abcdefghijklmnopqrstuvwxyz"; 
static int rmax = RAND MAX; 


assert(32767 «- rmax); 
assert (1 «- MB CUR MAX && MB CUR MAX <= MB LEN MAX): 
assert((sl = malloc(sizeof (abc))) != NULL); 
strcpy(sl, abc); 
assert((s2 = calloc(sizeof (abc) , 1)) != NULL 

&& s2[0] == "NO"); 
assert(memcmp(s2, s2 + 1, sizeof (abc) 
assert(strcmp(sl, abc) == 0); 
assert((sl - realloc (sl, 2 * sizeof (abc) - 1)) != NULL); 
strcat(sl, abc); 
assert(strrchr (sl, 'z') == s1 + 2 * strlen (abc) - 1); 
free(s2); 
assert((sl = realloc(sl, sizeof (abc) - 3)) != NULL); 
assert (memcmp (sl, abc, sizeof (abc) -3) == 0); 
assert (getenv("ANY") || system(NULL) || abc[0]); 
assert (abs (-4) == 4 && abs(4) == 4); 
assert (labs(-4) == 4 && labs(4) == 4): 
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assert(div(7, 2).quot == 3 && div(7, 2) .rem == 1); 
iqr = div(-7, 2); 
assert (igr.quot == -3 && igr.rem == -1); 
assert (ldiv(7, 2).quot == 3 && ldiv(7, 2).rem == 1); 
lar = ldiv(-7, 2); 
assert (lqr.quot == -3 && lqr. rem == -1); 
assert (0 <= (il = rand()) && il <= RAND MAX); 
assert (0 <= (i2 = rand()) && i2 <= RAND MAX); 
srand(1); 
assert(rand() == il && rand() == i2): 
assert (bsearch("0", abc, sizeof (abc) - 1, 1, &cmp) 
==NULL) ; 
assert(bsearch("d", abc, sizeof (abc) - 1, 1, &cmp) 
== &abc[3]):; 
asort (strcpy (buf, "mishmash"), 9, 1, &cmp); 
assert(memcmp(buf, "VOahhimmss", 9) == 0); 
assert(atof("3.0") == 3.0); 
assert(atof("-1e-17-") == -le-17); 
assert(atoi("37") == 37 && atoi("-7192x") == -7192); 
assert(atol("-29") == 29 && atol("-077") == -77); 
assert(strtod("28G", &sl) -- 28.0 
&& sl !- NULL && *sl -- 'G'); 
assert(strtol("-a0", &sl, 11) -- -110 
&& sl != NULL && *sl == "NO0'); 
assert(strtoul("54", &s1, 4) == 
&& Sl !- NULL && Seil == '5'); 
assert(strtoul("OxFfg", &sl, 16) == 255 
&& sl != NULL && *s1 --'g'); 
assert (mbstowcs(wcs, "abc", 4) == 3 && wcs[1] == 'b'); 
assert(wcstombs(buf, wcs, 10) -- 3 
&& strcmp (buf, "abc") == 0); 


mblen(NULL, 0); 
wctomb(NULL, 0); 


assert(mblen("abc", 4) -- 1); 

assert (mbtowc(&wcs[0], "abc", 4) == 1 && wcs[0] == 'a'); 
assert(wctomb(buf, wcs[0]) == 1 && buf[0] == 'a'); 
assert(mblem("", 1) -- 0); 

assert(mbtowc(&wcs[0], "", 1) == 0 && wcs[0] == 0); 
assert (wctomb (buf, wcs[0]) == 1 && buf[0] == '\0'); 


printf("RAND MAX = $1d*^n", (long) RAND MAX); 

printf("MB CUR, MAX = $u\n", MB CUR MAX); 

printf("Multibyte strings$s have shift states\n", 
mbtowc(NULL, NULL, 0) ? "" : " don't"); 

atexit(&done); 

Signal(SIGABRT, &abrt): 

abort(); 

puts("FAILURE testing «stdlib.h»"); 

return (EXIT FAILURE); 


} Li 
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13.7 Fm 


19.1. 下 面 的 区 域 设 置 函数 文件 定义 了 日 文中 的 汉字 的 多 字 节 编码 "Shift JIS". — 
个 在 区 间 [0x81,0x9F] 或 者 [0xE0, OxFC] 内 的 字符 编码 会 对 一 个 双 字 符 序列 的 
第 1 个 字符 发 出 信号 。( 任 何其 他 的 编码 都 是 一 个 字符 。) 第 二 个 字符 一 定 在 
区 间 [0x40, 0xFC] 中 。 


LOCALE SHIFT JIS 
NOTE JIS codes with 0x81-0x9F or OxEO-OxFC followed by 0x40-0xFC 


SET A 0x81 

SET B Ox9f 

SET C Oe 

SET D Oxfc 

SET M 0x40 

SET N Oxfc 

SET X 0 

mb cur mex 2 

mbtowc[0, 0:S#] $@ SF $O $I $0 
mbtowc[0, A:B ] $@ $F $R $I $1 
mbtowc[0, C:D ] $@ $F $R $I $1 
mbtowc[1, 0:S#] x 

mbtowc[1, M:N ] $@ SF SO $I $2 
mbtowc[2, O:Sf] 0 SF $R $0 
wctomb[0, 0:$#] $R $1 
wctomb[1, 0:S#] Xx 

wctomb[1, 0 ] SR SO $I $0 
wctomb[1, A:B ] $e SR $0 $2 
wctomb[1, C:D ] Sg SR $0 $2 
wctomb[2, 0:S#] X 

wctomb[2, M:N ] SO $I $0 


LOCALE end 


描述 一 下 这 个 区 域 设 置 文件 定义 的 多 字 节 字符 和 宽 字 节 字符 之 间 的 映射 关 
A. MH wctomb 和 mbtowc 的 状态 转换 图 。 


13.2 EUC (Extended UNIX Code， 扩 展 UNIX 编码 ) 中 的 一 个 定义 和 Shift JIS 很 
相似 。 区 间 [0xA1, OxFE] 中 的 一 个 字符 编码 是 一 个 双 字 符 序 列 的 第 一 个 ， 第 
二 个 字符 一 定 在 区 间 [0x80, OxFF] 中 。 修 改 上 题 中 的 区 域 设 置 文件 来 定义 这 
个 多 字 节 编码 。 描 述 一 下 你 是 怎样 实现 到 宽 字 节 字 符 的 映射 的 。 


133 下面 的 区 域 设置 文件 定义 了 具有 锁定 转移 状态 的 “JIS” 多 字 节 编码 。3 字符 
序列 “\33$B” 转 换 为 双 字 符 模 式 。3 字符 序列 “\33(B” 转 换 回 单字 符 模 式 。 
在 双 字 符 模 式 下 ， 这 两 个 字符 编码 一 定 都 在 区 间 [0x21,0x7E] 内 。 


LOCALE JIS 

NOTE JIS codes with ESC+(+B and ESC+$+B 
SET A 0x21 

SET B Ox7e 

SET X O 

SET Z 033 

mb cur max 5 


13.4 


13.5 


13.6 


mbtowc[0, 0:$#] $@ SF $0 $I $0 
mbtowc[0, 0 ] eg SF $0 $I $1 


mbtowc[0, Z  ] $I $1 
mbtowc[1, 0:$#] X 

mbtowcil, '(' ) $1 $2 
mbtowc[1, '$' ] $1 $3 


mbtowc[2, 0:$#] x 
mbtowc[2, 'B' ] 0 SF SR SI $0 
mbtowc[3, 0:$#] Xx 


mbtowc[3, 'B' ] SI $4 
mbtowc[4, 0:$#] X 

mbtowc[4, Z ] $I $1 
mbtowc[4, A:B ] $8 $F $R $1 $5 
mbtowc[5, 0:$#] X 

mbtowc[5, A:B ] $8 $F $O $I $4 
wctomb[0, 0:$#] $R $1 
wctomb[1, 0:$#] x 

wctomb[1, 0 J SR SO $I $0 
wetomb[1, A:B ] Z SO $2 
wctomb[2, 0:54] '$' SO $3 
wctomb[3, 0:$#] 'B' $0 $4 
wctomb[4, 0:S4] x 

wetomb[4, 0 JZ SO $7 
wctomb[4, A:B ] $@ SR $0 $5 
wctomb[5, 0:$#] Ka 

wctomb[5, A:B ] $0 SI $6 
wctomb[6, 0:S#] SR $4 
wctomb[7, 0:$8] '(' $0 $7+$1 
wctomb[8, 0:$#] 'B' $0 $1 
LOCALE end 


描述 一 下 这 个 区 域 设置 文件 定义 的 多 字 节 字符 和 宽 字 节 字 符 之 间 的 映射 关 
系 。 画 出 wctomb 和 mbtowc 的 状态 转换 图 。 


修改 存储 分 配 函 数 ， 使 它 最 多 可 以 维护 8 个 元 素 大 小 固定 的 表 。 在 已 经 存在 
的 元 素 表 中 加 入 一 个 相同 大 小 的 已 经 释放 的 项 。( 不 用 按 存 储 地 址 对 这 些 表 进 
THIF.) FU, MRS 个 表 中 还 有 一 些 表 没有 建立 ， 就 创建 一 个 新 表 。 如 
果 请 求 的 大 小 和 这 个 大 小 相同 ， 就 从 这 些 表 中 分 配 一 个 。 引 入 这 种 额外 的 复 
杂 性 有 什么 作用 ? 


修改 存储 分 配 函 数 ， 使 它 可 以 在 每 一 个 分 配 的 元 素 中 既 存 储 元 素 的 大 小 义 存 
储 一 个 信号 。 可 以 尝试 使 用 下 面 的 代码 : 

p - > Signature = p - > Size ^ (int)p ^ 0x01234567; 

(这 个 例子 假设 PP 和 P — > size 都 占据 32 位 ， 它 不 是 可 移植 的 代码 。) 检查 
每 一 个 要 释放 的 元 素 的 信号 。 引 入 这 种 额外 的 复杂 性 有 什么 作用 ? 

修改 存储 分 配 函 数 ， 要 求 所 有 分 配 的 空间 在 程序 终止 前 释放 。 需 要 修改 exit 


吗 ? 对 存储 分 配 函 数 这 样 使 用 要 遵循 哪些 原则 ? 引入 这 种 额外 的 复杂 性 有 什 
么 作用 ? 
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13.7 


13.8 


13.9 


实现 你 使 用 的 C 翻译 器 下 的 exit, getenv 和 system。 需 要 编写 汇编 代码 
ny? 


[ME] 修改 strtoa， 使 它 可 以 把 输入 串 Inf 转换 为 特殊 编码 Inf， 把 输入 串 
NaN 转换 为 特殊 编码 NaN。C 标准 允许 这 个 扩展 吗 ? 怎样 修改 «locale.h» 
中 的 代码 来 开启 和 关闭 这 个 转换 ? 能 设计 一 个 可 以 指定 任意 的 非 数 编码 的 符 


号 吗 ? 


[ 很 难 ] 修改 一 个 C 编译 器 ， 使 它 可 以 生成 abs. div, labs 和 ldiv 的 内 联 
代码 。 


<string.h> 


<string.h> 中 声明 的 函数 是 对 标准 C 的 一 个 重要 补充 ， 它 们 支持 C 语 
言 把 文本 作为 字符 数组 操作 的 传统 。 其 他 一 些 语言 很 好 地 集成 了 对 文本 串 的 
操作 ，SNOBOL 就 是 一 个 典型 的 例子 。C 吸收 的 语言 本 身 的 所 有 东西 就 是 空 字 
符 结尾 的 字符 串 字面 量 ， 例 如 "abc". C 标准 库 提供 了 所 有 重要 的 功能 。 这 
些 函 数 可 以 对 以 下 3 种 形式 的 串 进行 操作 。 


口 名 字 以 mem 开头 的 函数 对 任意 的 字符 序列 进行 操作 。 其 中 一 个 参数 
(s) 指向 字符 串 的 起 始 位 置 一 一 最 小 下 标的 元 素 ， 另 一 个 参数 (n) 
对 元 素 的 个 数 进行 计数 。 

D ZFA stra 开头 的 函数 对 非 空 字符 序列 进行 操作 。 参 数 s 和 nm MIS 
义 和 上 面 的 相同 。 这 些 串 恰好 在 元 素 s [n] WAAR, MATE stil 为 
零 ('\0') 的 第 一 个 i 处 结束 ， 这 两 个 定义 哪个 序列 较 短 ， 就 是 哪 
一 个 。 

O 所 有 其 他 名 字 以 str 开头 的 函数 对 空 字符 结尾 的 字符 序列 进行 操作 。 
这 些 函数 只 使 用 参数 s 来 确定 串 的 开头 。 


正如 我 们 所 期 望 的 ， 每 一 组 函数 都 有 它 特 定 的 用 途 。 


缺点 大 多 数 人 可 能 不 会 想到 这 些 函 数 有 一 些 设计 缺陷 。<string.h> 中 声明 
的 函数 不 是 共同 设计 努力 的 结果 。 相 反 ， 它 们 是 由 很 多 程序 员 在 很 长 的 时 间 
里 作出 的 贡献 积累 起 来 的 。 到 C 标准 化 开始 的 时 候 , “修整 ”它们 已 经 太 晚 
了 ， 太 多 的 程序 对 函数 的 行为 已 经 有 了 明确 的 定义 。 其 中 的 一 些 问题 如 下 。 


C) 很 多 搜索 函数 在 搜索 失败 的 时 候 返 回 一 个 空 指针 。 在 进一步 使 用 返回 
值 之 前 ， 必 须 先 找 到 它 并 且 对 它 进 行 测试 。 指 向 串 的 尾部 的 指针 和 一 
个 失败 编码 效果 一 样 ， 但 是 在 表达 式 中 它 会 更 有 用 。 

CJ 复制 函数 返回 一 个 指向 目标 区 域 的 起 始 位 置 的 指针 。 这 在 一 个 更 大 的 
表达 式 中 有 时 候 是 有 用 的 ， 但 是 副本 的 尾部 的 地 址 可 以 提供 更 有 用 的 
信息 。 使 用 后 面 的 返回 值 比 使 用 前 者 可 以 更 有 效 地 完成 多 重复 制 。 


386 £ 14% <string.h> 


D 某 些 沙 数 的 名 字 太 隐秘 了 。 例 如 ，strcspn 和 strpbrk 不 能 明确 说 明 
它们 的 作用 。 
D 这 些 函 数 的 集合 不 完整 并 且 不 一 致 。 例 如 ， 添 加 strnlen 和 memrchr 
这 两 个 函数 很 合理 ， 但 是 添加 strncat 有 点 令 人 吃惊 。 
尽管 有 这 些 缺 陷 ， 但 是 我 发 现 <string.h> 中 声明 的 函数 既 重 要 又 有 用 。 事 
实 上 ， 它 们 中 的 某 些 函 数 还 可 以 生成 内 联 代码 。 很 多 C 程序 使 用 这 些 函 数 ， 
并 且 经 常 使 用 。 它 们 值得 研究 和 优化 。 
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<string.h> | 7.11 字符 串 处 理 «string. h> 
7.11.1 PRAHE 

size t NULL 头 文件 <string.h> 声明 了 一 种 类 型 和 几 个 函数 ， 并 定义 了 一 个 宏 ， 这 个 宏 对 操作 字 
符 类 型 的 数组 和 其 他 可 以 作为 字符 数组 对 待 的 对 象 有 用 党。 声明 的 类 型 是 size t HÆ 
义 的 宏 是 NULL 《两 者 都 在 7.1.6 中 说 明 )。 确 定数 组 长 度 的 方法 有 很 多 种 ， 但 是 所 有 情况 
下 。char* 或 者 void* 参数 都 指向 数组 的 第 一 个 〈 最 低地 址 ) 字符 。 如 果 对 数组 的 访问 超 
出 了 对 象 的 结尾 ， 则 这 种 行为 未 定义 。 
7.11.2 复制 函数 


memcpy | 7.11.2.1 函数 memcpy 
概述 
include <string.h> 
void *memcpy(void *sl, const void *s2, size t n); 
说 明 
函数 memcpy 从 s2 指向 的 对 象 中 复制 n 个 字符 到 sl 指向 的 对 象 中 。 如 果 复 制 发 生 在 
两 个 重合 的 对 象 中 ， 则 这 种 行为 未 定义 。 
返回 值 
函数 memcpy 返回 s1 的 值 。 
memmove | 7.11.2.2 函数 memmove 
概述 
#include <string.h> 
void *memmove(void *sl, const void *s2, size t n); 
说 明 
函数 memmove 从 s2 指向 的 对 象 中 复制 个 字符 到 sl 指向 的 对 象 中 。 复 制 看 上 去 就 像 
先 把 n 个 字符 从 s2 指向 的 对 象 复 制 到 一 个 个 字符 的 临时 数组 中 ， 这 个 临时 数组 和 s1, 
s2 指向 的 对 象 都 不 重合 ， 然 后 再 把 这 n 个 字符 从 临时 数组 中 复制 到 sl 指向 的 对 象 中 。 
返回 值 
函数 memmove 返回 s1 的 值 。 
strcpy | 7.11.2.3 函数 stropy 
概述 
#include <string.h> 
char *strepy(char *s1, const char *s2); 
说 明 
函数 stropy 把 s2 指向 的 串 〈 包 括 终止 的 空 字符 ) 复制 到 sl 指向 的 数组 中 。 如 果 复 
制 发 生 在 两 个 重合 的 对 象 中 ， 则 行为 未 定义 。 
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strncpy 


strcat 


strncat 


memcmp 


返回 值 

PRA strcpy 返回 sl 的 值 。 
7.11.2.4 函数 strncpy 

概述 


finclude <string.h> 
char *strncpy(char *sl, const char *s2, size t n); 


说 明 

PR, strncpy 从 s2 指向 的 数组 中 复制 最 多 = 个 字符 〈 不 复制 空 字符 后 面 的 字符 ) 到 
sl 指向 的 数组 中 “，。 如 果 复制 发 生 在 两 个 重合 的 对 象 中 ， 则 行为 未 定义 。 

如 果 s2 指向 的 数组 是 一 个 长 度 比 n 短 的 字符 串 ， 则 在 si 指向 的 数组 后 面 添加 空 字 
符 ， 直 到 写 入 了 nn 个 字符 。 

返回 值 

rå Å strncpy 返回 sl 的 值 。 
7.11.3 连接 函数 


7.11.3.1 函数 streat 
概述 


finclude. <string.h> 
char *strcat(char *sl, const char "s2); 


说 明 
PAM streat 把 s2 指向 的 串 (包括 终止 的 空 字 符 ) 的 副本 添加 到 sl 指向 的 串 的 末尾 。 
s2 的 第 一 个 字符 覆盖 s1 REST. MRK PATER VESKE, MA RAAE NL. 
返回 值 
PRÉ strcat 返回 s1 的 值 。 
7.11.3.2 函数 strncat 
概述 


#include. <string.h> 
char *strncat(char *sl, const char *s2. size t n); 


说 明 

SÉ strncat 从 s2 指向 的 数组 中 将 最 多 mn 个 字符 〈 空 字符 及 其 后 面 的 字符 不 添加 ) 
添加 到 s1 指向 的 串 的 末尾 。s2 的 第 一 个 字符 覆盖 sl 末尾 的 空 字符 。 通 常 在 最 后 的 结果 后 
面 加 上 一 个 空 字符 “。 如 果 复 制 发 生 在 两 个 重 春 的 对 象 中 ， 则 行为 来 定义 。 

返回 值 

FR strncat 返回 s1 的 值 。 

$7. ei strlen (7.11.63). 
7.11.4 比较 函数 

TE Be PR TÉ memcmp, stremp 和 strncmp 返回 的 非 零 值 的 符号 由 参与 比较 的 对 象 中 的 
第 一 对 不 相等 的 若干 字符 都 解释 为 unsigned char 类 型 ) 的 差 值 的 符号 决定 。 
7.11.4.1 函数 memcmp 

概述 


#include <string.h> 
int memcmp(const void *sl, const void *s2, size t n); 


说 明 
PARK mememp 将 sl 指向 的 对 象 的 前 n 个 字符 和 s2 指向 的 对 象 的 前 n 个 字符 进行 比较 "5. 
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返回 值 
当 sl 指向 的 对 象 大 于 、 等 于 或 者 小 于 s2 指向 的 对 象 时 ， 函 数 memcmp 分 别 返 回 一 个 
大 于 、 等 于 或 者 小 于 零 的 整数 。 


strcmp | 7.11.4.2 函数 stremp 


strcoll 


strncmp 


strxfrm 


概述 
d include <string.h> 
int stremp(const char *sl. const char *s2); 
说 明 
函数 strcmp 对 s1 指向 的 串 和 s2 指向 的 串 进 行 比 较 。 
返回 值 
当 sl 指向 的 串 大 于 、 等 于 或 者 小 于 s2 mAP, RE strcmp 分 别 返回 一 个 大 
于 、 等 于 或 者 小 于 零 的 整数 。 
7.11.4.3 BA strcoll 
概述 
#include <string.h> 
int strcoll(const char *sl, const char *s2); 
说 明 
函数 strcoll 对 s1 指向 的 串 和 s2 指向 的 串 进行 比较 ， 只 是 比较 时 串 都 被 解释 为 适 
合 当前 区 域 设置 的 类 别 LC_COLLATE 的 形式 。 
返回 值 
当 两 个 串 都 被 解释 为 适合 当前 区 域 设 置 的 形式 后 ，sl 指向 的 串 大 于 、 等 于 或 者 小 于 
s2 指向 的 串 时 ， 函 数 strcoll 分 别 返回 一 个 大 于 、 等 于 或 者 小 于 零 的 整数 。 
7.11.4.4 函数 strncmp 
概述 
#include <string.h> 
int strncmp(const char *sl, const char *s2, size t n); 
说 明 
函数 strnemp 对 s1 和 s2 指向 的 数组 中 的 最 多 了 个 字符 《〈 空 字符 后 面 的 字符 不 参加 
比较 ) 进行 比较 。 
返回 值 
当 s1 指向 的 可 能 以 空 字符 结束 的 数组 大 于 、 等 于 或 者 小 于 s2 指向 的 可 能 以 空 字符 结 
束 的 数组 时 ， 函 数 strncmp 分 别 返回 一 个 大 于 、 等 于 或 者 小 于 零 的 整数 。 
7.11.4.5 函数 strxfrm 
概述 
#include <string.h> 
size_t strxfrm(char *sl, const char *s2, size t n); 
说 阴 
函数 strxfrm 转换 s2 指向 的 串 ， 并 把 结果 串 复制 到 sl 指向 的 数组 中 。 这 个 转换 满 
足 ， 使 用 strcmp 对 两 个 转换 后 的 串 进行 比较 时 ， 返 回 值 大 于 、 等 于 或 者 小 于 零 ， 分 别 对 
应 使 用 strcoll 对 两 个 相同 的 原始 串 进行 比较 的 结果 。 可 以 把 最 多 个 字符 放 到 s1 指向 
的 结果 数组 中 ， 包 括 终止 的 空 字符 。 如 果 n 是 零 ， 允 许 sl 是 一 个 空 指针 。 如 果 复 制 发 生 
在 两 个 重 芍 的 对 象 中 ， 则 行为 未 定义 。 
返回 值 
函数 strxfrm: 返 回转 换 串 (不 包括 终止 的 空 字符 〉 的 长 度 。 如 果 返 回 的 值 是 nn 或 者 
更 大 ， 则 sl 指向 的 数组 的 内 容 是 不 确定 的 。 
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strcspn 


strpbrk 


strrchr 
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例子 
下 面 的 表达 式 的 值 是 保存 s 指向 的 转换 串 所 需要 的 数组 大 小 。 


1 + strxfrm(NULL, s, 0) 
7.11.5 查找 函数 
7.11.5.1 Gë memchr 
概述 
#include <string.h> 
void *memchr(const void *s, int c, size_t n); 


说 明 
函数 memchr 确定 c (转换 为 unsigned char 类 型 ) 在 s 指向 的 对 象 的 前 n 个 字符 
(每 一 个 都 解释 为 unsigned char 类 型 ) 中 第 一 次 出 现 的 位 置 。 
返回 值 
函数 返回 指向 定位 的 字符 的 指针 ， 或 者 如 果 该 字符 没有 出 现在 对 象 中 则 返回 空 指针 。 
7.11.5.2 函数 strehr 
概述 
#include <string.h> 
char *strchr(const char *s, int c); 
说 明 
PRL strchr 确定 =〈 转 换 为 char KH) 在 s 指向 的 串 中 第 一 次 出 现 的 位 置 。 终 止 
的 空 字符 被 认为 是 串 的 一 部 分 。 
返回 值 . 
函数 strchr 返回 指向 定位 的 字符 的 指针 ， 或 者 如 果 该 字符 没有 出 现在 对 象 中 则 返回 
空 指针 。 
7.11.5.3 函数 strespn 
概述 
#include <string.h> 
size_t strcspn(const char *sl, const char *s2); 
说 明 
函数 strcspn 计算 s1 指向 的 字符 串 中 完全 由 不 是 s2 指向 的 串 中 的 字符 组 成 的 最 大 初 
始 段 的 长 度 。 
返回 值 
函数 strcspn 返回 段 的 长 度 。 
7.11.5.4 函数 strpbrk 
概述 


#include <string.h> 
char *strpbrk(const char *sl, const char *s2); 
说 阴 
函数 strpbrk 确定 s2 指向 的 串 中 的 任意 字符 在 sl 指向 的 串 中 第 一 次 出 现 的 位 置 。 
返回 值 
函数 strpbrk 返回 指向 找到 的 字符 的 指针 ， 或 者 如 果 s2 中 没有 字符 出 现在 sl 中 ， 则 
返回 空 指针 。 
7.11.5.5 BA strrchr 
概述 


#include <string.h> 
char *strrchr(const char *s, int c); 


<string.h> 


strspn 


strstr 


strtok 


说 明 
函数 strrchr 确定 c 转换 为 char 类 型 ) 在 s 指向 的 串 中 最 后 一 次 出 现 的 位 置 。 终 
止 的 空 字 符 被 认为 是 串 的 一 部 分 。 
返回 值 
函数 strrchr 返回 指向 找到 的 字符 的 指针 ， 或 者 如 果 该 字符 没有 出 现在 串 中 ， 则 返回 
空 指 针 。 
7.11.5.6 函数 strspn 
概述 
#include <string.h> 
size_t strspn(const char *sl, const char *s2); 
说 明 
函数 strspn 计算 sl 指向 的 字符 串 中 完全 由 s2 指向 的 串 中 的 字符 组 成 的 最 大 初始 段 
的 长 度 。 
返回 值 
函数 strspn 返回 段 的 长 度 。 
7.11.5.7 函数 strstr 
概述 
#include <string.h> 
char *strstr(const char *sl, const char *s2); 
说 明 
函数 strstr 确定 s2 指向 的 串 的 字符 序列 〈 不 包括 终止 的 空 字 符 ) 在 sl 指向 的 串 中 
第 一 次 出 现 的 位 置 。 
返回 值 
函数 strstr 返回 指向 定位 串 的 指针 ， 或 者 如 果 没 有 找到 该 串 ， 则 返回 一 个 空 指针 。 
如 果 s2 指向 一 个 长 度 为 零 的 串 ， 则 示 数 返回 s1. 
7.11.5.8 函数 strtok 
概述 


#include <string.h> 
char *strtok(char *sl, const char *s2); 

说 明 

对 函数 strtok 的 连续 调用 把 sl 指向 的 串 分 解 为 一 系列 记号 ， 每 个 记号 都 由 s2 指向 
的 串 中 的 字符 界定 。 对 这 个 序列 的 第 一 次 调用 把 sl 作为 它 的 第 一 个 参数 ， 后 面 的 调用 把 
空 指针 作为 它们 的 第 一 个 参数 。s2 指向 的 分 隔 串 可 能 在 每 次 调用 时 都 不 相同 。 

对 这 个 序列 的 第 一 次 调用 是 从 si 指向 的 串 中 搜索 第 一 个 在 s2 指向 的 当前 分 隔 串 中 
没有 包含 的 字符 。 如 果 没 有 找到 这 样 的 字符 ， 那 么 sl 指向 的 串 中 就 没有 任何 记号 ， 函 数 
strtok 返回 一 个 空 指针 。 如 果 找 到 了 这 样 的 字符 ， 它 就 是 第 一 个 记号 的 首 字符 。 

然后 函数 strtok 就 从 上 面 找到 的 字符 开始 搜索 当前 分 隔 串 中 包含 的 字符 。 如 果 没 有 
找到 这 样 的 字符 ， 当 前 的 记号 就 延伸 到 sl 指向 的 串 的 末尾 ， 后 面 对 一 个 记号 的 搜索 就 会 
返回 一 个 空 指针 。 如 果 找 到 了 这 样 的 字符 ， 它 就 会 被 一 个 空 字符 覆盖 ， 这 个 空 字符 终止 当 
前 的 记号 。 函 数 strtok 保存 指向 下 一 个 字符 的 指针 ， 下 一 次 对 某 个 记号 的 搜索 就 会 从 这 
里 开始 。 

后 面 的 每 一 次 调用 都 会 用 一 个 空 指针 作为 第 一 个 参数 的 值 ， 并 从 保存 的 指针 处 开始 搜 
索 ， 搜 索 行 为 和 上 文 描述 的 相同 。 

实现 的 行为 不 受 调用 函数 strtok 的 影响 。 

返回 值 

函数 strtok 返回 指向 一 个 记号 的 第 一 个 字符 的 指针 ， 如 果 没 有 记号 ， 就 返回 一 个 空 
SE. 
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memset 


strerror 


例子 
#include <string.h> 
static char str[] = "?a???b,,,#c"; 
char *t; 
t = strtok(str, "?"); /* t points to the token "a" */ 
t - strtok(NULL, ","); /* t points to the token "??b" */ 
t = strtok(NULL, "#,");/* t points to the token "c" */ 
t = Strtok(NULL, "?"); /* t is a null pointer */ 
7.11.6 其 他 函数 
7.11.6.1 函数 memset 
概述 
#include <string.h> 
void *memset (void *s, int c, size t n): 
VE BH 
函数 memset 把 c (Heth unsigned char 类 型 ) 的 值 复制 到 s 指向 的 对 象 的 前 mn 个 
字符 的 每 个 字符 中 。 
返回 值 


PRÉC memset 返回 s 的 值 。 


7.11.6.2 函数 strerror 


概述 


#include <string.h> 
char *strerror(int errnum); 


说 明 

函数 strerror 将 errnum 中 的 错误 编号 对 应 到 一 个 错误 信息 串 . 

实现 的 行为 不 受 调用 函数 strerror 的 影响 。 

返回 什 

函数 strerror 返回 指向 一 个 串 的 指针 ， 这 个 串 的 内 容 是 由 实现 定义 的 。 指 向 的 数组 


不 能 由 程序 修改 ， 但 可 能 通过 对 琐 数 strerror 的 后 续 调用 而 被 覆盖 。 


strlen | 7.11.6.3 AW strlen 


概述 


#include <string.h> 
size_t strlen(const char *s); 


说 阴 

函数 strlen 计算 s 指向 的 串 的 长 度 。 

返回 值 

函数 strlen 返回 终止 的 空 字符 前 面 的 字符 的 数目 。 

脚注 

133. 参考 “ 库 的 展望 ”(7.13.8)。 

134. 因此 ， 如 果 s2 指向 的 前 n 个 字符 中 没有 空 字符 ， 结 果 就 不 是 以 空 字符 结尾 的 。 

135. D. s1 指向 的 数组 的 字符 的 最 大 数目 是 strlen (s1)+n+1, 

136. 结构 对 象 内 部 为 了 对 齐 而 填充 的 “空隙 ”的 内 容 是 不 确定 的 。 相 比 之 下 ， 比 分 配 
的 空间 短 的 串 和 联合 也 会 造成 问题 。 
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14.3 <string.h> 的 使 用 


可 以 使 用 <string.h> 中 的 函数 对 字符 串 进行 操作 。 可 以 使 用 指向 串 的 


”起 始 位 置 的 指针 参数 〈 可 以 记 为 s) 来 描述 串 的 特征 。 


NULL 
size t 


memchr 


memcmp 


memcpy 


memmove 


memset 


D 如 果 一 个 串 可 以 包含 空 字符 ， 那 么 也 必须 指定 它 的 长 度 《〈 记 为 na) 作 
为 一 个 附加 的 参数 。n 可 以 为 零 。 此 时 使 用 名 字 以 mem 开头 的 函数 。 

D 如 果 一 个 串 可 能 有 ， 也 可 能 没有 终止 的 空 字符 ， 那 么 也 必须 指定 它 的 
RAKE n, n 可 以 为 零 。 此 时 使 用 名 字 以 strn 开头 的 函数 。 

C) 如 果 一 个 串 一 定 以 空 字符 结束 ， 那 么 只 需 指 定 s。 此 时 使 用 其 余 的 那 
些 名 字 以 str 开头 的 函数 。 


除了 这 个 简单 的 分 类 ， 其 他 串 函 数 之 间 的 联系 就 很 小 了 。 除 了 
<string.h> 中 定义 的 宏和 类 型 ， 下 面 还 会 单独 地 对 每 一 个 函数 进行 描述 。 


NULL 参考 11.3 节 。 
size t 参考 11.3 45. 


memchr 一 一 使 用 这 个 函数 来 确定 一 个 字符 在 一 个 已 知 长 度 的 字符 序列 
中 第 一 次 出 现 的 位 置 〈 下 标 最 小 的 那 一 个 )。 这 个 函数 把 第 一 个 参数 〈 字 符 
EA 强制 转换 为 指向 unsigned char 类 型 的 指针 ， 把 第 二 个 参数 (要 搜索 
的 字符 ) 强制 转换 为 unsigned char 类 型 。 这 样 可 以 保证 任何 字符 类 型 的 参数 
表达 式 行为 都 很 合理 并 且 可 以 预见 。 然 而 ， 若 搜索 失败 则 返回 空 指针 。 所 以 
在 使 用 返回 值 来 访问 内 存 之 前 一 定 要 对 它 进行 测试 。 同 样 也 要 注意 返回 值 是 
指向 void 类 型 的 指针 。 可 以 把 这 个 值 赋 给 一 个 字符 指针 ， 但 是 不 能 用 它 来 访 
问 内 存 ， 除 非 提 前 把 它 强 制 转换 为 某 种 字符 指针 类 型 。 


memcmp 一 一 这 个 函数 提供 了 确定 两 个 相等 长 度 的 字符 序列 的 字符 是 否 
一 一 对 应 的 最 快 的 方式 。 也 可 以 使 用 它 确定 两 个 字符 序列 的 词典 顺序 ， 但 是 
这 种 顺序 在 不 同 的 实现 下 可 能 不 同 。 如 果 结 果 的 可 移植 性 很 重要 ， 就 必须 单 
独 编写 对 应 的 比较 函数 。 


memcpy 一 一 如 果 确 定 目 标 串 sl 和 源 串 s2 AE, memcpy(sl,s2, 
n) 将 快速 而 安全 地 执行 复制 。 如 果 它 们 两 个 可 能 重要 ， 可 以 使 用 
memmove(s1,s2,n) 来 代替 它 。 不 要 认为 这 两 个 驮 数 以 任何 一 种 特殊 的 顺序 
访问 存储 空间 。 特 别 地 ， 如 果 想 在 一 个 字符 数组 的 相 邻 元 素 构成 的 序列 中 存 
储 相 同 的 值 ， 可 以 使 用 memset。 


memmove 参考 上 面 的 memcpy。 
memset 一 一 这 是 在 字符 数组 中 的 相 邻 元 素 构成 的 序列 中 存储 相同 的 值 


的 安全 方式 。 
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strcat 


strchr 


strcoll 


strcspn 


strerror 


strcat 如 果 只 需要 连接 两 个 串 sl 和 s2 或 者 几 个 短 串 ， 使 用 
strcat(s1,s2) 。 和 否则 ， 可 以 使 用 例如 strcpy(s1+=strlen(s1),s2) 这 样 的 
形式 。 这 样 可 以 避免 对 串 的 初始 部 分 进行 重复 的 和 不 断 延 长 的 重 扫描 。 要 保 
证 目标 数组 足够 大 可 以 存放 连接 起 来 的 串 。 注 意 ，strcat 返回 s1， 而 不 是 
指向 串 的 新 的 尾部 的 指针 。 


strchr 一 一 使 用 这 个 函数 确定 一 个 字符 在 一 个 以 空 字符 结尾 的 字符 串 中 
第 一 次 出 现 的 位 置 ( 下 标 最 小 的 那个 )。 函 数 把 第 二 个 参数 (搜索 的 字符 〉 强 
制 转换 为 char 类 型 ,这样 可 以 保证 任意 字符 类 型 的 参数 表达 式 的 行为 都 很 
合理 并 且 可 以 预见 。 然 而 ， 若 搜索 失败 ， 则 返回 空 指针 。 所 以 ， 在 想 要 使 用 
返回 值 访问 存储 空间 之 前 ， 要 保证 先 对 它 进 行 测试 。 注 意 对 strchr(s,'\0') 
的 调用 返回 一 个 指向 终止 的 空 字符 的 指针 。 也 可 以 参考 下 面 讲述 的 strcspn、 
strpbrk 和 strrchr。 


strcmp 一 一 这 个 函数 提供 了 确定 两 个 以 空 字符 结尾 的 字符 串 的 字符 是 否 
一 一 对 应 的 最 快 的 方式 。 也 可 以 使 用 它 确 定 两 个 串 的 词典 顺序 ， 但 是 这 种 顺 
序 在 不 同 的 实现 下 可 能 不 同 。 如 果 结 果 的 可 移植 性 很 重要 ， 则 必须 编写 对 应 
的 比较 隧 数 。 也 可 以 参考 下 面 描述 的 strcoll 和 strxfrm。 


strcoli1 一 一 使 用 这 个 函数 来 确定 两 个 以 空 字符 结尾 的 字符 串 在 指定 区 域 
设置 下 的 词典 顺序 。 用 户 必 须知 道 当 前 的 区 域 设置 类 别 LO COLLATE 的 状态 ， 
这 样 才 可 以 妥当 地 使 用 这 个 函数 。( 至 少 必须 假设 其 他 某 个 人 已 经 合理 地 设置 
了 这 个 类 别 。) 在 某 些 环境 下 ， 可 能 会 使 用 下 面 讲 述 的 strxfrm 来 代替 它 。 


strepy— 如果 可 以 保证 目标 串 sl ARB s2 NES, AA strepy 
(s1,s2) 将 安全 并 快速 地 执行 复制 操作 。 如 果 它 们 可 能 重 倒 ， 使 用 
memmove (s1,s2,strlen(s2)*1) 来 代替 它 。 不 要 认为 这 两 个 函数 可 以 以 任何 
特定 的 顺序 访问 内 存 。 


strcspn 一 一 strcspn 和 strchr 很 相似 ， 但 它 匹 配 的 是 任意 一 个 字符 集 而 
不 是 一 个 字符 。 这 使 得 它 也 和 strpbrk 很 相似 。 然 而 ， 注 意 ，strcspn 返回 一 
个 串 的 索引 而 不 是 指向 其 中 一 个 元 素 的 指针 。 如 果 它 没有 发 现 匹 配 ， 它 返回 终止 
的 空 字符 的 索引 ， 而 不 是 一 个 空 指针 。 因 此 ， 调 用 strcspn(s,"a") 会 比 调用 
strchr (s, 'a') BL strpbrk(s,"a") 更 加 方便 。 


使 用 strerror (errcode) 来 确定 和 错误 编码 errcode 相 
对 应 的 以 空 字 符 结尾 的 信息 串 。( 第 3 章 描述 了 宏 errno 和 标准 错误 编码 。) 
exrcode 应 该 是 errno 或 者 <errno h> 中 定义 的 名 字 以 王 开头 的 某 个 安 。 要 
保证 在 下 一 次 调用 strerror 之 前 复制 或 者 写 出 这 些 信息 。 如 果 只 是 想 把 包 
含 strerror (ermo) 的 信息 写 人 标准 错误 流 ， 可 以 参考 <stdio.h> 中 声明 
的 perror, 


strerror 
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strlen 


strncat 


strncpy 


strpbrk 


strspn 


scrlen 一 在 任何 可 能 的 地 方 使 用 这 个 函数 来 确定 一 个 以 空 字符 结尾 的 
字符 串 的 长 度 。 它 可 能 用 内 联 代码 实现 。 


strncat(sl,s2,n2) 中 的 strn 是 指 函 数 连 接 到 以 空 字 符 结 
尾 的 串 sl 的 尾部 的 串 52. ÅRS ER n2 个 字符 ， 如 果 它 没有 复制 终止 的 
空 字符 的 话 ， 还 会 加 上 一 个 终止 的 空 字符 。 因 此 ， 调 用 strncat 的 结果 最 多 
使 strlen(sl) 增 大 n2。 这 就 使 strncat H streat 更 加 安全 ， 虽 然 可 能 以 
截取 s2 的 前 n2 个 字符 为 代价 。 


strncmp 一 一 这 个 函数 提供 了 比较 两 个 具有 相同 长 度 的 字符 序列 是 否 
一 一 对 应 的 最 快 的 方式 ， 最 多 可 以 比较 到 这 两 个 串 中 的 任意 空 字符 而 且 包 含 
该 空 字符 。 也 可 以 使 用 它 来 对 两 个 这 样 的 字符 序列 进行 词典 排序 ， 但 是 这 种 
顺序 依 实现 而 不 同 。 如 果 结 果 的 可 移植 性 很 重要 ， 那 么 就 必须 编写 自己 的 比 
BE PRL 0 

strncpy 一 一 如 果 可 以 确定 目标 串 sl 和 源 串 s2 没有 重合 ，strncpy 
(s1l,s2,n2) 将 安全 地 执行 复制 操作 。 然 而 ,水 数 在 sl 处 精确 地 存储 n2 
个 字符 ， 它 可 能 丢弃 尾部 的 字符 ， 包 括 终止 的 空 字符 。 函 数 会 根据 需要 存 
储 一 些 额 外 的 空 字 符 来 弥补 一 个 短 的 计数 。 如 果 两 个 区 域 可 能 重合 ， 使 用 
memmove(s1,s2,n2) 来 代替 它 。( 必 须 在 结尾 存储 适当 数量 的 空 字符 ， 如 果 
这 很 重要 的 话 。) 不 要 认为 这 两 个 函数 以 任意 特定 的 顺序 访问 存储 空间 。 


strpbrk 和 strchr 很 相同 ， 不 过 它 匹配 的 是 任意 一 个 
字符 集 而 不 是 一 个 字符 。 这 使 得 它 也 和 strcspn 很 相似 。 然 而 ， 注 意 ， 
strcspn 返回 一 个 串 的 索引 而 不 是 指向 其 中 一 个 元 素 的 指针 。 如 果 它 没有 
发 现 匹 配 ， 它 返回 终止 的 空 字符 的 索引 而 不 是 一 个 空 指针 。 因 此 ， 调 用 
strcspn(s,"abc") 会 比 调用 strpbrk (s, "abc") 更 加 方便 。 


strzchr 一 使 用 这 个 函数 来 确定 一 个 字符 在 一 个 以 空 字符 结尾 的 字 
符 串 中 最 后 一 次 出 现 的 位 置 〈 下 标 最 大 的 一 个 )。 南 数 把 第 二 个 参数 〈 搜 
索 字 符 ) 强制 转换 为 char 类 型 。 这 样 可 以 保证 任何 字符 类 型 的 参数 表 
达 式 的 行为 都 很 合理 并 可 预见 。 然 而 ， 哲 搜索 失败 ， 则 返回 空 指针 。 所 
以 ， 在 想 要 使 用 返回 值 访 问 存储 空间 之 前 ， 要 保证 先 对 它 进行 测试 。 注 意 ， 
strrchr(s,'\0') 返回 一 个 指向 终止 的 空 字符 的 指针 。 也 可 以 参考 上 面 讲 述 
的 strchr、strcspn 和 strpbrk。 


可 以 把 strspn AEE strcspn 的 补 函数 。 它 搜索 一 个 和 一 个 
字符 集中 的 任意 元 素 都 不 匹配 的 字符 ， 而 不 是 和 任意 一 个 匹配 。strspn 也 返回 
这 个 串 的 索引 ， 或 者 如 果 它 没有 找到 匹配 ， 就 返回 终止 的 空 字符 的 索引 。 因 此 ， 
调用 strspn (s, "abc") 会 找到 来 自 集合 "abc" 的 最 长 可 能 的 字符 跨越 。 


strncat 


strpbrk 


strspn 


strstr 


strtok 


strxfrm 
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strstr 


可 以 用 strstrisl,s2) 来 确定 子 串 s2 在 字符 串 si 中 第 一 
次 出 现 的 位 置 。 一 个 成 功 的 搜索 返回 指向 sl 中 的 子 串 的 起 始 位 置 的 指针 。 
若 搜索 失败 ， 则 返回 一 个 空 指针 。 


这 是 一 个 复杂 的 函数 ， 它 设计 的 目的 是 把 一 个 空 字符 结尾 的 
字符 串 分 解 为 多 个 记号 。 可 以 指定 分 隔 字符 的 集合 。 记 号 之 间 存 在 一 个 或 者 
多 个 分 隔 符 的 序列 。 这 样 的 序列 也 可 以 存在 于 第 一 个 记号 之 前 或 者 最 后 一 个 
记号 之 后 。strtok 内 部 记录 了 停止 分 析 串 的 位 置 。 因 此 ， 使 用 strtok 一 次 
只 能 对 一 个 串 进行 处 理 。 例 如 ， 这 里 有 一 个 代码 序列 ， 它 对 串 Line 中 的 每 
个 “ 字 ” 调 用 word 函数 。 代 码 序列 把 一 个 字 定 义 为 不 包含 “空白 ”的 最 长 
可 能 的 字符 序列 ， 这 里 的 空白 定义 为 空格 符 、 水 平 制 表 符 或 者 换行 符 。 


strtok 


Char *s; 
for (s = line; (s = strtok(s, " \t\n")) != NULL; s = NULL) 
word (s); 


第 一 次 调用 strtok 时 ， 它 的 第 一 个 参数 是 一 个 非 空 指 针 。 这 样 就 开始 了 
从 line 的 起 始 位 置 的 扫描 。 后 读 调 用 用 NULL 代替 了 这 个 参数 来 继续 扫描 。 
如 果 任 何 调用 的 返回 值 都 不 是 一 个 空 指针 ， 那 么 它 指向 一 个 不 包含 分 隔 符 的 且 
以 空 字符 结尾 的 字符 串 。 注 意 ，strtok 把 空 字符 存储 在 从 line 开始 的 串 中 。 
所 以 要 保证 这 个 存储 空间 是 可 写 的 ， 并 且 不 需要 为 以 后 的 处 理 进 行 保留 。 


顺便 说 一 下 ， 可 以 为 处 理 一 个 给 定 串 的 strtok 的 每 一 次 调用 指定 不 同 
的 分 隔 符 集合 。 


strxfrm— —— DI strxfrm(s1,s2,n) 来 将 空 字符 结尾 的 字符 串 s2 转 
换 为 sl 处 的 一 个 (不 重 登 的) 版本。 通过 这 种 方法 转换 的 串 以 后 可 以 通过 
strcmp 来 进行 比较 。 这 个 比较 就 确定 了 转换 前 的 两 个 串 在 指定 区 域 设 置 中 的 
词法 顺序 。 必 须知 道 区 域 设置 类 别 LC COLLATE 的 当前 状态 ， 这 样 才能 妥当 
地 使 用 这 个 函数 。( 至 少 必须 假设 其 他 某 个 人 已 经 合理 地 设置 了 这 个 类 别 。) 
在 大 多 数 环境 下 ， 可 能 会 使 用 上 面 讲 过 的 strcolI 来 代替 它 。 如 果 计 划 进 行 
重复 的 比较 或 者 区 域 设置 可 能 在 比较 之 前 改变 ， 就 可 以 使 用 strxfrm。 使 用 
<stdlib.h> 中 声明 的 函数 malloc 来 为 sl 分 配 存储 空间 ， 就 像 下 面 的 代码 
那样 : 


Size t n = strxfrm(NULL, s2, 0); 
char *sl = malloc (n + 1); 


if (s1) 
strxfrm(sl, s2, n); 


对 strxfrm 的 第 一 次 调用 确定 了 需要 的 存储 空间 的 大 小 。 第 二 次 调用 
《又 一 次 ) 执行 转换 并 且 把 转换 后 的 串 存 储 在 分 配 的 数组 中 。 
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14.4 <string.h> 的 实现 


<string.h> 中 声明 的 函数 工作 时 彼此 都 很 独立 。 例 外 的 函数 只 有 
strcoll 和 strxfrm。 它 们 通过 两 种 不 同 的 方式 执行 本 质 上 相同 的 操作 ， 我 
在 最 后 讨论 它们 。 剩 下 的 每 一 个 函数 都 执行 一 个 相当 简单 的 操作 。 这 里 的 自 
标 是 把 它们 编写 得 清晰 、 健 壮 并 且 高 效 。 


头 文件 图 14-1 显示 了 文件 string.h。 和 往常 一 样 ， 它 从 内 部 头 文件 <yvals.h> 
<string.h> 中 继承 了 那些 在 几 个 标准 头 文件 中 重复 使 用 的 定义 。 第 11 章 已 经 讨论 了 宏 
NULL 和 类 型 定义 size t 的 实现 。 


图 14-1 /* string.h standard header */ 
string.h #ifndef | STRING 
#define STRING 
#ifndef  YVALS 
finclude «yvals.h» 
fendif 


/* macros */ 
#define NULL NULL 
/* type definitions */ 
*ifndef  SIZET 
#define  SIZET 
typedef  Sizet size t; 
#endif 


/* declarations */ 
void *memchr(const void *, int , size_t); 
int memcmp(const void *, const void *, size_t); 
void *memcpy(void *, const void *, size_t); 
void *memmove(void *, const void *, size_t); 
void *memset (void *, int, size_t); 


char *strcat(char *, const char *); 
char *strchr(const char *, int); 
int strcmp(const char *, const char *); 
int strcoll(const char *, const char *); 
char *strcpy(char *, const char *); 
size t strcspn(const char *, const char *); 
char *strerror(int); 
size t strlen(const char *); 
char *strncat(char *, const char *, size t); 
int strncmp(const char *, const char *, size t); 
char *strncpy(char *, const char *, size t); 
char *strpbrk(const char *, const char *); 
char *strrchr(const char *, int); 
size t strspn(const char *, const char *); 
char *strstr(const char *, const char *); 
char *strtok(char *, const char *); 
size t strxfrm(char *, const char *, size t); 
char * Strerror(int , char *); 

/* macro overrides */ 
#define strerror(errcode) _Strerror(errcode, NULL) 
fendif 
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Ej Å mememp 


BR a memcpy 


14-2 
memchr.c 


图 14-3 


memcmp.c 


RAMM strerror (HIT —A Blk 2c. EAI <stdio.h> 中 声明 的 函 
数 perror 共用 内 部 函数 Strerror, 124 节 讨 论 了 其 中 的 原因 。 


<string.h> 中 声明 的 其 他 几 个 函数 可 以 作为 生成 内 联 代码 的 内 置 函 数 
实现 。 通 常 的 做 法 是 用 私有 的 名 字 给 这 些 内 置 版 本 命名 ， 然 后 可 以 提供 屏 项 
宏 来 获得 对 这 些 内 置 函 数 的 访问 。( 参 考 0.2 节 的 C 标准 的 脚注 96.) 因此， 
<string.h> 的 产品 版 本 可 能 会 包含 几 个 附加 的 屏蔽 宏 。 


让 我 们 从 mem 函数 开始 。 图 14-2 显示 了 文件 memchr .c。 函 数 memchr 
的 主要 关心 的 是 分 清 各 种 各 样 的 类 型 。 必 须 把 指针 和 字符 参数 赋值 给 不 同类 
型 的 动态 数据 对 象 。 这 就 需要 把 数组 元 素 作为 unsigned char 类 型 正确 而 高 效 
地 进行 比较 。 返 回 值 表 达 式 中 编写 (void*) 强制 类 型 转换 是 为 了 清晰 性 ， 它 
并 不 是 必需 的 。 

图 14-3 显示 了 文件 memcmp .c。memcmp 也 要 认真 地 执行 unsigned char 
类 型 的 比较 来 满足 C 标准 的 要 求 。 

图 144 显示 了 文件 memcpy。 我 选择 char 作为 memcpy 的 内 部 工作 类 
型 ， 某 些 计算 机 体系 结构 可 能 会 使 用 unigned char， 但 这 种 可 能 性 很 小 。( 这 
是 选择 一 个 “普通 的 ”字符 类 型 的 一 个 理由 。〉memcpy 可 以 假设 它 的 源 串 和 


/* memchr function */ 
finclude «string.h» 


void *(memchr) (const void *s, int c, size t n) 
( /* find first occurrence of c in s[n] */ 
const unsigned char uc - c; 
const unsigned char *su; 


for (su = s; 0« n; ««su, --n) 
if (*su -- uc) 
return ((void *)su); 
return (NULL); 
) 


/* memcmp function */ 
#include <string.h> 


int (memcmp) (const void *s1, const void *s2, 
Size t n) 
t /* compare unsigned char s1[n], s2[n] */ 
const unsigned char *sul, *su2; 


for (sul - s1, su2 ; ; ++sul, ++su2, --n) 
if (*sul != *gu2) 
return ((*sul < *su2) ? -1 : +1); 
return (0); 


) 
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图 144 /* memcpy function */ 
memcpy.c #include <string.h> 


void *(memcpy) (void *sl, const void *s2, size t n) 
{ /* copy char s2[n] to sl[n] in any order */ 
char *sul; 
const char *su2; 


for (sul = sl, su2 = s2; 0 < n; ++sul, ++su2, --n) 
*sul - *su2; 
return (s1); 


图 14-5 /* memmove function */ 
memmove.c #include <string.h> 


void *(memmove) (void *s1, const void *s2, size t n) 
{ /* copy char s2[n] to s1 [n] safely 


char *scl; 
const char *sc2; 


sci sl; 
sc2 s2; 
if (sc2 < scl && scl < sc2 + n) 
for (scl += n, sc2 += n; 0 < n; --n) 
*--scl = *--sc2; /*copy backwards 
else 
for (; 0 « n; --n) 
*scl++ = *sc2++; /* copy forwards 
return (s1); 


} 


图 14-6 


memset .c 


/* memset function */ 
#include <string.h> 


void *(memset) (void *s, int c, size t n) 
{ /* store c throughout unsigned char s[n] */ 
const unsigned char uc = c; 
unsigned char *su; ` 


for (su = s; 0 < n; ++su, --n) 
*su = uc; 
return (s); 
) 口 


目的 串 不 重合 。 因 此 ， 它 可 以 执行 它 能 做 的 最 简单 的 复制 操作 。 


函数 memmove 图 14-5 显示 了 文件 memmove.c. DÉI memmove 必须 能 正确 地 工作 ， 甚 
至 当 它 的 两 个 操作 数 有 重 炙 的 时 候 。 因 此 ， 它 首先 检查 一 个 可 能 会 阻止 一 个 
升序 复制 的 正确 操作 的 重生。 如 果 有 重 倒 发生 ， 它 就 按照 降序 复制 元 素 。 
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图 14-7 
strncat.c 


图 14-8 


strncmp.c 


函数 memset 


函数 strncat 


函数 strnemp 


函数 strncpy 


strcat 


strcmp 
strcpy 


/* strncat function */ 
#include <string.h> 


char *(strncat) (char *sl, const char *s2, size t n) 
H /* copy char s2[max n] to end of s1[] 
char ze: 


for (s = sl; *s ! = '\O'; ++s) 


; /* find end of s1[] 

for (; 0 < n && *s2 ! 'NO'; --n) 
*ø++ = *S2++; /* copy at most n chars from s2[] 

*g = 'NO'; 

return (sl); 

} 


/* strnemp function */ 
#include <string.h> 


int (strnemp) (const char *s1, const char *s2, size t n) 
{ /* compare unsigned char si[max n] , s2 [max n] 
for (; 0 < n; ++sl, **s2, --n) 
if (*s1 ! - *s2) 
return ((*(unsigned char *)s1 
< *(unsigned char *)s2) ? -1 : +1); 
else if (*s1 == '\0') 
return (0); 
return (0); 


) 


图 14-6 显示 了 文件 memset.c。 我 选择 unsigned char 作为 memset 内 部 
的 工作 类 型 ， 某 个 实现 可 能 会 产生 一 个 把 int 值 存储 在 其 他 字符 类 型 中 的 洲 
出 ， 但 是 这 种 可 能 性 极 小 。 | 

现在 考虑 一 下 3 个 strn 函数 ， 图 147 显示 了 文件 strncat.c. RÅ 
strncat 首先 确定 目标 串 的 终点 位 置 ， 然 后 ， 它 把 源 串 中 的 最 多 mn 个 字符 连 
接 上 去 。 注 意 这 个 函数 总 是 提供 一 个 终止 的 空 字 符 。 

图 14-8 显示 了 文件 strmemp.c, PRA strncmp 和 memcmp 很 相似 ， 但 是 
它 也 在 一 个 终止 的 空 字 符 处 停止 。 而 且 和 memcmp 不 一 样 的 是 ，strncmp 可 
以 直接 使 用 它 的 指针 参数 。 它 可 以 把 它们 强制 转换 为 指向 unsigned char 类 型 
的 指针 ， 这 仅仅 为 了 计算 一 个 非 零 的 返回 值 。 

图 14-9 显示 了 文件 strncpy.c。 同 样 ， 函 数 strncpy 和 memcpy 很 相 
似 ， 只 不 过 它 在 一 个 终止 的 空 字符 处 停止 。strncpy 也 有 个 不 恰当 的 要 求 ， 
就 是 对 一 个 长 度 小 于 了 的 串 来 说 ， 它 必须 用 空 字 符 来 填充 。 

str 函数 中 有 3 个 和 stra 函数 非常 相似 。 图 14-10 到 图 14-12 显示 了 文 
få strcat.c、strcmp.c 和 strcpy.c. PB Zi strcat、strcmp 和 strepy 与 
stm 函数 的 不 同 之 处 只 在 于 不 用 担心 有 限 的 串 长 度 n。 当 然 ，strcpy 也 不 
用 处 理 填 充 字 符 。 
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图 14-9 /* strnepy function */ 
strncpy.c #include <string.h> 


char * (strncpy) (char *sl, const char *s2, size_t n) 


{ /* copy char ei [max n] to sl[n]) */ 
char *s; 
for (s = sl; 0 < n && *g2 !- 'NO'; --n) 

"att = *S2++; /* copy at most n chars from s2[] */ 
for (; 0 < n; --n) 

Zeit = '\O'; 
return (sl); 
} oO 


图 14-10 /* streat function */ 
streat.c #include <string.h> 


char *(strcat) (char *sl, const char *s2) 


{ /* copy char s2[] to end of s1[] */ 
char *s; 


*s t= 'NO'; 8) 
/* find end of s1[] */ 
*s2) !- '\O'; +4+s, ++52) 
/* copy s2[] to end */ 
return (s1); 


} 口 


图 14-11 /* strcmp function */ 
strcmp.c #include <string.h> 


int (stremp) (const char *sl, 
const char *s2) 
{ /* compare unsigned char sl[], s2[] */ 


for (; *sl == *s2; ++s1, ++82) 
if(*sl == '\0') 
return (0); 
return ((* (unsigned char *) 51 
< *(unsigned char *)s2) ? -1 : +1); 


) 


图 14-12 /* strcpy function */ 


strcpy.c #include <string.h> 


char *(strepy) (char *sl, const char *s2) 


{ /* copy char s2[] to s1[] */ 
char *s = s1; 


for (s = sl; (*s++ = *92++) != '\O';) 
return (s1); 
} D 
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图 14-13 


strlen.c 


图 14-14 
strchr.c 


Æ 14-15 


strcspn.c 


ER XT strlen 


函数 strchr 
strcspn 
strpbrk 
strspn 


/* strlen function */ 
#include <string.h> 


size_t (strlen) (const char *s) 


{ /* find length of s[] */ 
const char *sc; 


for (sc = s; Sec != '\0'; ++sc) 


return (SC - s); 


} 


/* strchr function */ 
#include <string.h> 


char *(strchr) (const char *s, int c) 
{ /* find first occurrence of c in char s[] */ 
const char ch = c; 


for (; *s != ch; ++s) 
if (*s == '\0"') 
return (NULL); 
return ((char *) s); 


} 


/* strespn function */ 
#include <string.h> 


size t (strcspn) (const char *sl, const char *s2) 
{ /* find index of first sl{i] that matches any s2[] */ 
const char *scl, *sc2; 


for (scl = sl; *scl !- 'NO'; ++scl) 
for (sc2 = s2; *sc2 !- '\0'; ++sc2) 
if (*scl == *sc2) 
return (scl - s1); 
return (scl - s1); /* terminating nulls match */ 


j 口 


图 14-13 显示 了 文件 strlen.c. PRA strlen 可 能 是 <string.h> 中 声 
明 的 函数 中 使 用 最 频繁 的 一 个 。 它 最 有 可 能 作为 内 置 函 数 实 现 。 如 果 这 种 形 
式 存 在 ， 就 去 寻找 strlen 隐藏 为 内 联 代码 的 地 方 。 函 数 streat 和 strncat 
就 是 两 个 明显 的 例子 。 


有 7 个 函数 通过 各 种 不 同 的 方式 扫描 字符 串 。 图 14-14 显示 了 文件 
strchr.c, M% strchr 是 这 些 函 数 中 最 简单 的 一 个 ， 它 明显 和 memchr 
很 相似 。 


图 14-15 到 图 14-17 显示 了 文件 strcspn.c. strpbrk.c 和 strspn.c. 
strcspn 和 strpbrk 执行 相同 的 功能 ， 只 是 返回 值 不 同 。 函 数 strspn 是 
strcspn 的 补 函数 。 
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图 14-16 /* strpbrk function */ 
strpbrk.c #include <string.h> 
char *(strpbrk) (const char *s1, const char *s2) 
{ /* find index of first sl[i] that matches any s2[] */ 
const char *scl, *sc2; 
for (scl = si; *scl != '\0'; ++sc1) 
for (sc2 = s2; *sc2 != '\0'; ++sc2) 
if (*scl == *sc2) 
return ((char *)scl); 
return (NULL); /* terminating nulls match */ 
] 口 
图 14-17 /* strspn function */ 
strspn.c include <string.h> 
size_t (strspn)(const char Sal, const char *s2) 
{ /* find index of first sl[i] that matches no s2[] */ 
const char *scl, *sc2; 
for (scl = sl; *scl != '\O'; ++sc1) 
for (sc2 = s2; ; ++sc2) 
if (*sc2 == '\0') 
return (scl - s1}; 
else if (*scl == *sc2) 
break ; 
return (scl - s1); /* null doesn't match */ 
) o 
图 14-18 /* strrchr function */ 
strrchr.c #include <string.h> 
char *(strrchr) (const char *s, int c) 
{ /* find last occurrence of c in char s[] */ 
const char ch = c; 
const char *sc; 
for (sc = NULL; ; ++s) 
{ /* check another char */ 
if (*s == ch) 
sc = 8; 
if (*s == '\0') 
return ((char *)sc); 
) 
) 口 
函数 strrchr 图 14-18 显示 了 文件 strrchr.c. A% strrchr 是 对 strchr 的 一 个 有 


用 的 补 。 它 记录 指向 sc 中 的 最 右边 的 元 素 〈 如 果 有 的 话 ) 的 指针 。 返 回 语句 
中 的 强制 类 型 转换 是 必需 的 ， 因 为 在 这 种 情况 下 ，sc 指向 一 个 常量 类 型 。 
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图 14-19 /* strstr function */ 


strstr.c #include <string.h> 
char *(strstr) (const char *sl, const char *s2) 
{ /* find first occurrence of s2[] in s1[] */ 
if (*s2 == '\0') 
return ((char *)s1); 
for (; (sl = strchr(sl, *s2)) ! = NULL; ++s1) 
{ /* match rest of prefix */ 
const char *scl, *sc2; 
for (scl = sl, sc2 = s2; ; ) 
if (isch == '\0') 
return ((char *)s1); 
else if (*++scl ! = *sc2) 
break; 
) 
return (NULL); 
H 口 
图 14-20 /* strtok function */ 
strtok.c 


#include <string.h> 


char *(strtok) (char *sl, const char *s2) 


{ /* find next token in s1[] delimited by s2[] */ 
char *sbegin, *send; 
static char *ssave = ""; /* for safety */ 


sbegin = s1 ? sl : ssave; 

sbegin += strspn(sbegin, s2); 

if (*sbegin == '\0'} 
{ /* end of scan */ 
ssave = ""; /* for safety */ 
return (NULL); 
} 

send = sbegin + strcspn(sbegin, s2); 

if (*send ! = '\0') 
*send++ = 'NO'; 

ssave = send; 

return (sbegin); 


) 口 


函数 strstr 图 14-19 显示 了 文件 strstr.c. PRM strstr 调用 strchr 来 在 sl rng 
RE s2 的 第 一 个 字符 。 只 有 找到 时 ， 它 才 使 用 所 需 的 东西 来 检查 s2 的 其 他 
部 分 是 否 和 s1 的 一 个 子 串 相 匹配 。 这 个 函数 把 空 串 s2 作为 一 种 特殊 情况 对 
待 ， 它 和 si 起 始 位 置 隐藏 的 空 串 相 匹配 。 


函数 strtok 图 14-20 显示 了 文件 strtok.c. PE strtok 是 7 个 串 扫 描 函 数 中 最 DI 
后 一 个 也 是 最 复杂 的 一 个 。 它 看 起 来 并 不 是 很 糟 因为 这 里 它 是 在 strspn 和 
strpbrk 的 基础 上 编写 出 来 的 。 然 而 ， 它 必须 对 付 可 写 的 静态 存储 空间 和 多 
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重 调用 问题 来 处 理 相同 的 串 。 可 能 正确 地 使 用 它 EE A. 
24 strtok HARE ENER, Cen eem, dx IP ET 
阻止 不 正当 的 调用 导致 函数 对 存储 空间 的 无 效 访问 。 Ep 它 正在 扫描 的 串 
的 存储 空间 被 释放 了 ， 这 个 函数 仍然 很 危险 。) 
strerror 图 14-21 显示 了 文件 strerror.c。 它 既定 义 了 strerror, BÆR T 
.Strerror 


图 14-21 


strerror.c 


部 函数 Strerror. (4 12.4 节 中 对 <stdio.h> 中 声明 的 函数 perror 调 
用 Strerror 的 原因 的 说 明 。〉_Strerror 在 一 个 缓冲 区 中 建立 某 些 错误 编 
码 的 文本 表示 ， 它 只 有 被 strerror 调用 的 时 候 才 使 用 它 自 己 的 静态 缓冲 区 。 
这 里 我 只 对 <errno.n> 的 这 个 实现 中 定义 的 错误 编码 的 最 小 集合 提供 具体 的 
信息 。 用 户 可 能 会 想 添 加 更 多 。 任 何 未 知 的 错误 编码 都 作为 3 位 10 进 制 数 
打印 输出 。 


/* strerror function */ 
include «errno.h» 
#include <string.h> 


char *_Strerror(int errcode, char *buf) 
{ /* copy error message into buffer as needed */ 
static char sbuf[] = ("error #xxx"}; 


if (buf == NULL) 


buf = sbuf; 
switch (errcode) 

{ /* switch on known error codes */ 
case 0: 

return ("no error"); 
case EDOM: 


return ("domain error"); 
case ERANGE: 
return ("range error"); 


case EFPOS : 
return ("file positioning error"); 
default: 
if (errcode < 0 || _NERR <= errcode) 
return ("unknown error"); 
else 
{ /* generate numeric error code */ 


strcpy (buf, "error #xxx"); 

buf [9] = errcode % 10 + '0'; 

buf [8] (errcode /= 10) % 10 + '0'; 
buf [7] (errcode / 10) % 10 + '0'; 
return (buf); 


) 


Uu! 


) 


char *(strerror) (int errcode) 
{ /* find error message corresponding to errcode */ 
return (_Strerror(errcode, NULL)}; 


} a 
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整理 函数 


头 文件 


"xstrxfrm.h" 


函数 strufrm 


Bye Strxfrm 


图 14-22 
xstrxfrm.h 


<string.h> 中 声明 的 最 后 两 个 函数 帮助 执行 特定 区 域 设置 下 的 字符 串 整 
理 。strcoll 和 strxfrm 都 通过 把 串 转 换 为 某 种 形式 来 确定 整理 顺序 ， 这 种 
形式 使 用 stremo 比较 时 ， 可 以 得 到 正确 的 整理 。 区 域 设 置 类 别 LC_COLLATE 
确定 这 种 转换 。( 参 考 第 6 章 .) 它 通过 指定 内 部 丽 数 _Strxfrm 使 用 的 状态 
表 来 完成 这 个 功能 。 因 此 strcoll 和 strxfrm 调 用 ._Strxfrm 来 正确 地 转换 
字符 串 。 


图 14-22 显示 了 文件 xstrxfrm.h。 所 有 的 整理 函数 都 包含 内 部 头 文 
件 "xstrxfrm.h"。 该 头 文件 又 包含 标准 头 文件 <string.h> 和 内 部 头 文件 
"xstate.h"。( 参 考 图 6-5 的 文件 xstate.h。) 除 此 之 外 ，"xstrxfrm.h" 定 
义 了 类 型 _Ccosave 并 且 声 明了 函数 Strxfrm, — Å _Cosave 类 型 的 数据 对 
象 在 调用 _Strxfrm 之 间 存 储 状态 信息 。 


图 14-23 显示 了 文件 strxfrm.c. pA strxfrm 最 好 地 阐述 了 整理 函 
数 是 怎样 在 一 起 工作 的 。 它 在 sl 指向 的 缓冲 区 中 存储 了 长 度 为 n 的 转换 字 
符 串 。 一 旦 缓冲 区 满 ， 函 数 就 转换 源 串 的 剩余 部 分 来 确定 转换 串 的 总 长 度 。 
stzxfzm 把 所 有 多 余 的 字符 存储 在 它 自 己 的 动态 临时 缓冲 区 buf 中 。 


Kl 14-24 显示 了 文件 xstrxfrm.c， 它 定义 了 图 数 _Strxfrm， 这 个 
函数 执行 了 实际 的 转换 。 它 是 作为 执行 存储 在 _wcstate 中 的 状态 表 的 有 
限 状态 机 来 实现 这 个 功能 的 ，_wcstate 由 文件 xstate.c EX. (BER 
6-11.) 


_Strxfrm 一 定 要 特别 严密 ， 因 为 westate 可 能 会 有 缺陷 。 它 可 能 会 随 
着 区 域 类 别 Lc COLLATE 而 改变 ， 且 改变 方式 是 C 标准 库 不 能 控制 的 。 

注意 ， 出 现 以 下 情况 时 ， 函 数 可 以 选择 错误 返回 。 

D 如 果 发 生 了 向 一 个 未 定义 的 状态 的 转移 。 

o 如 果 一 个 给 定 的 状态 不 存在 对 应 的 状态 表 。 


C) 如 果 函 数 产 生 一 个 输出 字符 时 要 做 太 多 的 状态 转移 以 致 它 必 须要 循环 。 
C) 如 果 状 态 表 入 口 专门 报告 了 一 个 错误 。 


/* xstrxfrm.h internal header */ 
#include <string.h> 
#include "xstate. h" 
/* type definitions */ 

typedef struct { 

unsigned char _State; 

unsigned short _Wchar; 

} _Cosave; 
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图 14-23 


strxfrm.c 


/* strxfrm function */ 
#include "xstrxfrm.h" 


Size t (strxfrm) (char *s1, const char *s2, size t n) 
{ /* transform s2[] to s1[] by locale-dependent rule 
Size t nx = 0; 
const unsigned char *s - (const unsigned char *)s2; 
_Cosave state = {0}; 


while (nx < n) 


{ /* translate and deliver 
size_t i = Strxfrm(sl, &s, n - nx, &state); 


sl += i, nx += i; 
if (0 < i && sl[-1] == "AT! 
return (nx - 1); 
else if (*s == '\0') 
s = (const unsigned char *)s2; /* rescan 
H 
for (; ; ) 
{ /* translate and count 
char buf[32]; 
size t i = Strxfrm(buf, &s, sizeof (buf), &state); 


nx += i; 
if (0 « i && buf[i - 1] 
return (nx - 1); 
else if (*s == '\0') 
s = (Const unsigned char *)s2; /* rescan 
) 


相 比 较 而 言 ，_Strxfrm RAAB ABE EAA. IN ROSE VF 
符 累 加 器 (ps-» Wchar) 作为 状态 存储 的 一 部 分 保留 下 来 。 在 一 个 给 定 的 转 
移 状态 下 时 ， 这 就 简化 了 用 一 个 普通 的 组 件 生成 一 个 转换 字符 序列 的 工作 。 
_Strxfrm 在 它 〈 用 size 个 字符 ) 填 满 输出 缓冲 后 ， 或 者 遇 到 源 串 中 的 终止 
的 空 字 符 时 返回 。 


这 可 能 会 不 只 一 次 发 生 。 注 意 strxfrm BEG _strcfrm 返 回 的 3 种 原因 
的 方式 : 


D 如 果 传 递 的 最 后 一 个 字符 是 空 字符 ， 转 换 就 完成 了 。 如 果 发 生 了 一 
个 错误 ，_Strxfrm 就 传递 一 个 空 字符 。 它 也 会 记录 存储 的 状态 信息 ， 
这 样 ， 当 它 再 次 不 小 心 调用 同样 的 串 时 ， 它 就 会 立即 失败 。 

D 否则 ， 如 果 下 一 个 源 字符 是 空 字符 ，_Strxfrm 会 重新 扫描 源 串 。 
_Strxfrm 不 会 越过 源 串 中 的 一 个 空 字符 。 

O 否则 ，_Stzxfrm 会 在 它 停止 的 地 方 继续 执行 。 


Æ 14-24 


xstrxfrm.c 


14.4 <string.h> 的 实现 407 


/*  Strxfrm function */ 
#include <limits.h> 
#include "xstrxfrm.h" 


size t Strxfrm(char *sout, const unsigned char **psin, 
Size t size,  Cosave *ps) 
{ /* translate string to collatable form 
char state = ps-> State; 
int leave = 0; 
int limit = 0; 
int nout = 0; 
const unsigned char *sin = *psin; 
unsigned short wc = ps-> Wchar; 


for (; ; ) 
H /* perform a state transformation 
unsigned short code; 
const unsigned short *stab; 


if ( NSTATE <= state 

|| (stab = Costate. Tab[state]) == NULL 

I| (ANSTATE*UCHAR MAX) <= ++limit 

|| (code = stab[*sin]) == 0) 

break; 
state = (code & ST STATE) >> ST STOFF; 
if (code & ST FOLD) 

we = wc & -UCHAR MAX | code & ST CH; 
if (code & ST ROTATE) 

we = wc >> CHAR BIT & UCHAR MAX | wc << CHAR BIT; 
if (code & ST OUTPUT && ((sout[nout++] 

= code & ST CH ? code : wc) == "N0" 

|| size «- nout)) 

leave = 1; 

(code & ST INPUT) 

if (rein != '\0') 

++sin, limit = 0; 
else 
leave = 1; 

(leave) 

{ return for now 

*psin = sin; 

ps->_State = state; 

ps-» wchar = wc; 

return (nout); 

} 
} 


sout [nout++] = '\0'; /*error return */ 


*psin = sin; 
ps->_State = _NSTATE; 
return (nout); 


} 
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图 14-25 /* strcoll function */ 
strcoll.c #include "xstrxfrm. h" 


/* type definitions */ 
typedef struct ( 
char buf[32]; 
const unsigned char *sl, *s2, 
.Cosave state; 
) Sctl; 


Static size t getxfrm(Sctl *p) 


{ /* get transformed chars 
size_t i; 


do { /* loop until chars delivered 
p->sout = (const unsigned char *)p->buf; 
i = _Strxfrm(p->buf, &p->sl, sizeof (p->buf), &p->state); 
if (0 < i && p->buf[i - 1] == '\0’) 
return (i - 1); 
else if (*p->s1 == '\0') 
p-»sl = p->s2; /* rescan 
) while (i -- 0); 
return (i); 


} 


(strcoll) (const char *sl, const char *s2) 

{ /* compare si[], s2[] using locale-dependent rule 
size_t nl, n2; 

Sctl stl, st2; 

static const _Cosave initial = {0}; 


stl.sl = (const unsigned char *)s1; 
stl.s2 = (const unsigned char *)s1; 
stl.state = initial; 
st2.sl = (const unsigned char *)s2; 
st2.s2 = (const unsigned char *)s2; 
st2.state = initial; 
for (nl = = 0; ; ) 
/* compare transformed chars */ 


0) 
= getxfrm(&stl); 
0) 
= getxfrm(&st2); 
n2 ? nl: n2; 
0) 
return (nl == n2 ?0 : 0«n2 ? -1 : +1); 
else if ((ans = memcmp(stl.sout, st2.sout, n)) != 0) 
return (ans); 
stl.sout += n, ni 
st2.sout += n, n2 


) 
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Å strcoll 图 14-25 显示 了 文件 strcoll.c, PRX strcoll H strxfrm 稍 微 复 杂 
点 。 它 必须 对 两 个 源 串 进行 转换 ， 并 且 一 次 只 能 转换 一 段 ， 这 样 它 就 可 以 比 
较 它 们 的 转换 形式 。 类 型 Sctl 描述 了 保存 处 理 每 个 源 串 所 需 信息 的 数据 对 
象 。 内 部 图 数 getxfrm 调用 _Strxfrm 来 对 Sctl 数据 对 象 进 行 更 新 。 


strcoll 内 部 的 循环 比较 对 Sctl 缓冲 中 每 一 个 没有 转换 字符 的 源 串 ， 
都 会 调用 getxfrm。 这 就 保证 了 如 果 还 需要 产生 任何 这 样 的 字符 ， 则 每 一 个 
源 串 至 少 用 一 个 转换 字符 表示 。strcol1l 比较 它 所 能 比较 的 所 有 转换 字符 。 
只 有 当 两 个 转换 串 的 对 应 字符 都 相等 并 且 长 度 相 同时 ， 它 才 返 回 零 。 


14.5 <string.h> 的 测试 


图 14-26 显示 了 文件 tstring.c。 测 试 程序 对 <string.h> 中 声明 的 每 
一 个 函数 执行 了 一 些 粗略 的 测试 。 这 个 头 文件 没有 定义 独 有 的 宏 或 者 类 型 ， 
所 以 ， 也 没有 什么 有 意义 的 大 小 可 以 显示 。 如 果 一 切 顺利 ， 测 试 程序 只 显示 
如 下 信息 : 


SUCCESS testing «string.h- 


146 参考 文献 
R.E. Griswold, J.F. Poage, and I.P. Polonsky, The SNOBOL4 Programming Language, 
(Englewood Cliffs, N.J.: Prentice-Hall, Inc. 1971). 程序 设计 语言 SNOBOL 把 模 
式 匹 配 和 文本 串 内 的 替换 推 向 了 顶峰 。 读 者 可 能 会 对 在 字符 串 操作 的 基础 上 
可 以 完成 的 功能 强大 的 程序 而 感到 惊奇 。 
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14.1 下 面 的 区 域 设 置 文件 定义 了 一 个 简单 的 “字典 ”整理 顺序 ， 这 个 顺序 忽略 了 
标点 符号 和 大 小 写 的 区 别 。 


LOCALE DICT 
NOTE dictionary collation sequence 


collate[0, 0 yr. $0 $I $1 
collate[0, 1:S# ] SI $0 
collate[0, 'a':'z'] $e SO $I $0 
collate[0, 'A':'Z'] $8«'a'-'A' SO SI $0 
collate[l, 0:$# ] $e $0 $1 $1 
LOCALE and 


描述 一 下 它 执 行 的 转换 。 它 为 什么 要 重新 扫描 ? 为 这 个 转换 画 一 个 状态 转换 
图 。 
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图 14-26 /* test string functions */ 
tstring.c finclude «assert.h» 
finclude «errno.h» 
#include <stdio.h> 
#include <string.h> 


int main() 


{ /* test basic workings of string functions */ 
chat s[20]; 

size tn; 

Static const char abcde[] = "abcde"; 


Static const char abcdx[] = "abcdx"; 
assert (memchr (abcde, 'c',5) == &abcde[2]); 
assert (memchr (abcde, rer, Ai == NULL); 
assert (memcmp (abcde, abcdx,5) ! = 0); 
assert (memcmp(abcde, abcdx,4) == 0); 

/* the following tests are interrelated */ 
assert (memcpy(s, abcde, 6) == s && s[2] == 'c'); 
assert (memmove(s, s + 1,3) == s); . 
assert(memcmp(memmove(s, s + 1, 3), "aabce", 6)); 
assert(memcmp((char *)memmove(s * 2, s, 3) - 2, 

"beece", 6)); 
assert(memset(s,'*', 10) -- s && s[9] -- '*'); 
assert(memset(s + 2, '$', 0) == s + 2 && s[2] == '*'); 
assert(strcat(memcpy(s, abcde, 6), "fg") -- s); 
assert(s[6] == 'g'); 
assert(strchr(abcde, 'x') -- NULL); 
assert(strchr(abcde, 'c') == &abcde[2]); 
assert(strchr(abcde, 'X0') == &abcde[5]); 
assert(strcmp(abcde, abcdx) ! - 0); 
assert(strcmp(abcde, "abcde") -- 0); 
assert(strcoll(abcde, "abcde") == 0); 
assert(strcpy(s, abcde) == s && stremp(s, abcde) == 0); 
assert (strcspn(abcde, "xdy") == 3); 
assert (strcespn(abcde, "xzy") == 5); 
assert (strerror(EDOM) != 0); 
assert (strlen(abcde) == 5); 
assert (strlen("") == 0); 
assert (strncat(strcpy(s, abcde), "fg", 1) == s 

&& stremp(s, "abcdef") == 0); 
assert (strncmp (abcde, "abcde", 30) == 0); 
assert (strncmp(abcde, abcdx, 30) != 0); 
assert (strncmp(abcde, abcdx, 4) == 0); 
assert(strncpy(s, abcde, 7) == s 

&& memcmp(s, "abcde\0", 7) == 0); 
assert (strncpy(s, "xyz", 2) == s 

&& stremp(s, "xycde") == 0); 
assert (strpbrk (abcde, "xdy") == &abcde[3]); 
assert (strpbrk(abcde, "xzy") == NULL); 
assert (strrehr(abcde, 'x') == NULL); 
assert (strrchr(abcde, ‘c’) == &abcde[2]):; 
assert (stremp(strrchr ("ababa", 'b'),"ba") == 0); 
assert (strspn (abcde, "abce") == 3); 
assert (strspn(abcde, abcde) == 5); 


图 14-26 
( 续 ) 


14.2 


14.3 


14.4 


14.5 


14.6 


assert (strstr(abcde, "xyz") == NULL); 


assert (strstr(abcde, "cd") == &abcde[2]); 
assert(strtok(strcpy(s, abcde), "ac") == &s[1]); 
assert(strtok(NULL, "ace") == &s[3]); 
assert(strtok(NULL, "ace") == NULL 

&& memcmpís, "“ab\Qd\0\0", 6) == 0); 
n = strxfrm(NULL, abcde, 0); 
if (n < sizeof (s) - 1) 

assert (strxfrm(s, abcde, n +1) == n 

&& strlen(s) == n) ; 

puts ("SUCCESS testing <string.h>"); 


return (0); 
L 1 D 


修改 上 题 中 的 区 域 设 置 文件 ， 对 以 Mac 开头 和 以 Mc 开头 的 名 字 进 行 排序 ， 这 
两 种 名 字 是 等 价 的 ， 只 有 当 一 些 名 字 比 较为 相等 时 才 将 mac 名 字 排 在 Mc 名 
字 的 前 边 。 

为 下 面 的 内 容 写 出 一 个 精确 的 规格 说 明 : 

D 你 的 电话 笑 中 的 名 字 的 排序 方法 ; 

口 你 使 用 的 词典 中 字 的 排序 方法 ; 

口 你 使 用 的 计算 机 中 的 排序 函数 对 文本 行进 行 排序 的 方法 。 
定义 一 个 区 域 设 置 ， 它 可 以 和 这 些 整理 规则 中 的 每 一 个 行为 相 匹 配 。 它 要 使 
用 多 少 种 状态 来 指定 每 一 个 规则 ? 

一 个 简单 的 计算 器 程序 识别 下 面 的 记号 ; 

O <stdlib.h> 中 声明 的 函数 strtod 可 接受 的 数 〈 参 考 图 13-1); 

D 集合 [+ - * / =c] 中 的 运算 符 ; 

口 双 引 号 之 间 的 注释 。 

这 些 记 号 被 空格 、 水 平 制 表 符 和 换行 符 分 隔 开 。 然 而 ， 这 样 的 字符 可 以 出 现 
在 注释 中 。 

编写 一 个 程序 ， 这 个 程序 可 以 从 标准 输入 流 读 入 字符 ， 然 后 把 它们 分 解 为 车 
干 个 记号 。 使 用 <string.h> 中 声明 的 函数 strtok。 重 新 编写 该 函数 而 不 使 
用 strtok。 你 更 喜欢 这 两 个 版 本 中 的 哪 一 个 ? AA? 

找 出 <string.h> 中 没有 声明 的 “缺失 ”的 肾 数 (例如 strnlen HI memrchr) 
并 实现 它们 。 能 把 它们 添加 到 C 标准 库 中 并 且 仍 然 和 C 标准 保持 一 致 吗 ? 能 把 
它们 的 声明 添加 到 <string.h> 并 且 仍 然 和 C 标准 保持 一 致 吗 ? 
测试 一 个 大 代码 集 ， 确 定 <string.h> 中 声明 的 且 耗 费时 间 最 多 的 $ 个 函数 。 
如 果 这 些 函 数 瞬 间 就 可 以 完成 ， 你 可 以 使 一 个 典型 的 程序 的 速度 提高 多 少 ? 
如 果 每 - -个 函数 都 加 快 5 倍 ， 你 可 以 使 一 个 典型 程序 的 速度 提高 多 少 ? 对 于 
你 测试 的 速度 提高 最 多 的 程序 来 说 ， 哪 些 方面 是 可 以 用 数字 来 比较 的 ? 


412 £ 14% <string.h> 


143 [3€] 为 上 题 中 找 出 的 函数 编写 汇编 语言 版 本 。 仅 仅 通 过 改变 C (OR PR AT LA 
大 大 提高 它 的 速度 吗 ? 和 它们 的 C 版 本 相 比 ， 每 一 个 函数 可 以 快 多 少 ? 


14.8 [很 难 ] 修改 一 个 C 编译 器 ， 使 它 为 你 在 前 两 道 题 中 找到 的 函数 产生 内 联 代 
码 。 和 它们 上 题 中 的 版 本 相 比 ， 每 个 函数 可 以 快 多 少 ? 


15.1 


| «time.h» 


BRA 


fi iia] 


识 

在 UNIX 操作 系统 下 ， 时 间 和 日 期 计算 达到 了 一 个 新 的 水 平 ， 有 几 个 
系统 开发 者 是 天 文 爱好 者 。 他 们 对 表示 几 十 年 内 ， 而 不 仅仅 是 几 年 内 的 时 间 
的 需求 很 敏感 。 他 们 自发 地 使 用 了 格林 尼 治 平时 〈 过 去 记 作 GMT, MEE 
UTC)， 而 不 仅仅 是 墙 上 的 钟表 的 时 间 。 总 之 ， 他 们 比 大 多 数 人 更 讲究 在 计 
算 机 上 计算 和 表示 时 间 。 


对 这 方面 的 细节 的 关注 已 经 扩展 到 了 C 标准 库 中 。 它 的 范围 基本 上 包 
括 了 UNIX 下 任何 可 用 C 实现 的 不 依赖 于 UNIX 特性 的 东西 。 因 此 ， 可 以 
用 标准 C 的 时 间 和 日 期 进行 多 种 操作 ，<time .nh> 中 声明 的 了 涌 数 提供 了 相关 
的 服务 。 


Ui BE PUR KR SE UNIX 的 特性 有 一 点 夸张 。 并 不 是 所 有 的 操作 系统 都 
区 分 本 地 时 间 和 UTC， 甚 至 没什么 系统 允许 不 同 的 用 户 显 示 不 同时 区 的 时 
间 。 某 些 最 小 的 操作 系统 甚至 不 提供 时 间 。 然 而 如 果 想 和 C 标准 一 致 的 话 ， 
所 有 的 C 实现 就 必须 在 合理 地 显示 时 间 方 面 下 功夫 。 


为 了 让 几乎 所 有 人 都 能 摆脱 困境 ，C 标准 包含 了 足够 的 推 话 词 。 要 和 C 
标准 一 致 ， 一 个 系统 只 需要 提供 和 当前 的 时 间 和 日 期 ， 或 者 和 处 理 器 耗费 的 
时 间 最 接近 的 值 。 一 个 厂商 可 以 说 1980 年 1 月 1 日 总 是 任何 时 间 和 日 期 的 
最 佳 近似 值 ， 顾 客 可 能 会 对 这 样 低 质 量 的 近似 值 有 些 争论 ， 但 是 他 们 不 会 争 
论 这 是 否 满 足 了 Ch. 


这 些 说 明 的 真正 含义 是 一 个 程序 绝 不 能 太 认 真 地 对 待 时 间 。 它 可 以 询问 
当前 的 时 间 (通过 调用 time)， 也 可 以 显示 以 各 种 漂亮 的 格式 得 到 的 时 间 ， 
但 是 它 不 能 确切 地 知道 时 间 和 日 期 有 很 重要 的 意义 。 如 果 遇 到 一 个 严格 依靠 
精确 的 时 间 标 志 的 程序 ， 就 要 去 仔细 地 检查 标准 C 的 每 一 个 实现 。 
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152 C 标准 的 内 容 


«time.h» | 7.12 日 期 和 时 间 <time.h> 


7.12.1 时 间 的 构成 

头 文件 <time.h> EMT RR, 声明 了 四 种 类 型 和 几 个 操作 时 间 的 函数 。 很 多 函数 
都 处 理 表示 当前 日 期 (根据 公历 ) 和 时 间 的 日 历时 间 。 有 些 函 数 处 理 本 地 时 间 ( 就 是 表示 
某 个 特定 时 区 的 日 历时 间 ) 和 夏令 时 是 对 确定 本 地 时 间 的 算法 的 临时 替代 )。 本 地 时 区 


和 夏令 时 都 是 实现 定义 的 。 
NULL 定义 的 宏 有 NULL (7.1.6 中 有 描述 ) 和 
CLOCKS PER SEC CLOCKS PER SEC 


它 是 函数 clock 的 返回 值 的 每 秒 的 时 间 单 位 数 。 
size t 声明 的 类 型 有 size t (7.1.6 HAHA 


clock t clock t 
和 
time 七 time t 
它们 是 可 以 表示 时 间 的 算术 类 型 ， 
struct tm struct tm 


它 保存 了 一 个 日 历时 间 的 各 组 成 部 分 ， 日 历时 间 被 称 为 细 分 时 间 。 这 个 结构 至 少 应 该 
按照 某 种 顺序 包含 以 下 成 员 。 注 释 部 分 说 明了 这 些 成 员 的 语义 和 它们 一 般 的 取 值 范围 ”。 


int tm sec; /* seconds after the minute - [0, 61] */ 
int tm min; /* minutes after the hour - [0, 59] */ 
int tm hour; /* hours since midnight - [0, 23] */ 

int tm mday: /* day of the month - [1, 31] */ 

int tm mon; /* months since January - [0, 11] */ 

int tm year: /* years since 1900 */ 

int tm wday; /* days since Sunday - [0, 6] */ 

int tm yday; /* days since January 1 - [0, 365] */ 


int tm isdst;  /* Daylight Saving Time flag */ 
如 果 夏 令 时 有 效 ， 则 tm isdst WAKE, ADEJCARUNOUTE, FEBER ANA. 
7.12.2 时 间 操 纵 函 数 
clock | 7.12.2.1 函数 clock 
概述 


#include <time.h> 
clock t clock (void); 


说 明 
函数 clock 确定 处 理 器 使 用 的 时 间 。 
返回 值 
函数 clock 返回 程序 使 用 的 处 理 器 时 间 的 最 佳 近似 值 ， 这 个 时 间 从 只 和 程序 启动 有 关 
的 实现 定义 的 某 个 时 期 开始 计算 。 如 果 要 以 秒 为 单位 计算 ， 则 只 需 把 函数 clock 的 返回 值 
MEDIZ CLOCK PER SEC 即 可 。 如 果 不 能 获得 使 用 的 处 理 器 时 间或 者 这 个 值 不 能 表示 ， 则 函 
数 返 回 值 (clock t)-1"5, 
difftime | 7.12.2.2 BA difftime 
概述 
#include <time.h> 
double difftime(time t timel, time t time0); 
说 明 
函数 difftime 计算 两 个 日 历时 间 之 差 : timel-timeO. 
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返回 值 
PAIK di fftime 返回 以 秒 为 单位 的 double 类 型 的 差 值 。 


mktime | 7.12.2.3 函数 mktime 


概述 
#include <time.h> 
time t mktime(struct tm *timeptr); 
说 明 
函数 mktime 把 timeptr 指向 的 结构 中 的 表示 为 本 地 时 间 的 细 分 时 间 转 换 为 一 个 日 历 
时 间 值 ， 这 个 值 和 time 函数 的 返回 值 的 编码 相同 。 结 构成 员 tm_wday 和 tm_yday 的 初始 
值 被 忽略 不 管 ， 其 他 成 员 的 初始 值 不 受 上 面 说 明 的 取 值 范围 的 限制 ”。 车 成 功 完成 ， 则 结 
构 的 成 员 tm_wGay 和 tm vday 被 正确 设置 ， 同 时 其 他 的 成 员 也 被 设置 来 表示 指定 的 日 历 
时 间 ， 但 是 它们 的 值 必 须 在 上 面 说 明 的 范围 内 ， 直 到 确定 了 tm mon 和 tm year FARE 
tm mday 的 最 终 值 。 
返回 值 
函数 mktime 返回 表示 为 time 上 类 型 的 编码 值 的 日 历时 间 。 如 果 日 历时 间 不 能 被 表 
示 ， 则 函数 返回 值 (time t)-1. 
例子 
计算 2001 年 7 月 4 日 是 星期 几 。 
#include <stdio.h> 
#include <time.h> 
static const char *const wday(] = ( 
"Sunday", "Monday", "Tuesday", "Wednesday", 
"Thursday", "Friday", "Saturday", "-unknown-" 
eet. tm time str; 
[*...*4 


time str.tm year 
` time str.tm mon 

time str.tm mday 

time str.tm hour 0; 

time str.tm min 0; 

time str.tm sec 1; 

time str.tm isdst - -1; 

if (mktime(&time str) -- -1) 

time str.tm wday - 7; 
printf("%s\n", wday[time str.tm wday]); 


7.12.2.4 函数 time 
概述 


2001 - 1900; 
7-13; 
4; 


#include «time.h» 
time t time(time t *timer); 
说 阴 
函数 time 确定 当前 的 日 历时 间 ， 返 回 值 的 编码 方式 未 指定 。 
返回 值 
函数 time 返回 和 当前 日 历时 间 最 近似 的 值 。 如 果 不 能 获得 日 历时 间 ， 则 返回 
(time t)-1, å timer 不 是 空 指针 ， 则 返回 值 赋值 给 它 指定 的 对 象 。 
7.12.3 时 间 转 换 函 数 


除了 函数 strftime 之 外 ， 这 些 函数 的 返回 值 都 存储 在 以 下 某 种 静态 对 象 中 : 一 个 细 
分 时 间 结 构 和 一 个 char 类 型 的 数组 。 任 意 晴 数 的 执行 都 可 能 覆盖 其 他 函数 返回 的 某 个 静 
态 对 象 中 的 信息 。 实 现 的 行为 不 受 这 些 函 数 调用 的 影响 。 
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asctime | 7.12.3.1 函数 asctime 


概述 


finclude <time.h> 
char *asctime(const struct tm *timeptr); 


说 明 

函数 asctime 把 timeptr 指向 的 结构 表示 的 细 分 时 间 转 换 为 以 下 形式 的 串 。 
Sun Sep 16 01:03:52 1973\n\0 

其 中 使 用 了 与 下 面 等 价 的 算法 : 


char *asctime(const struct tm *timeptr) 


{ 


static const char wday_name[7] [3] = { 

"Sun", "Mon", "Tue", "Wed", "Thu", "Fri" , "Sat" 
3 
static const char mon name[121[3] = I 


"Jan", "Feb", "Mar", "Apr", "May", "Jun", 
"Jul", "Aug", "Sep", "Oct", "Nov", "Dec" 

HE 

static char result [26]; 


sprintf (result. "$.3s %.3s%3d %.2d:%.2d:%.2d %din", 
wday name [timeptr-»tm wday], 
mon name[timeptr-»tm mon], 
timeptr-»tm mday, timeptr-»tm hour, 
timeptr-»tm min, timewptr->tm sec, 
1900 + timeptr-»tm year); 

return result; 


— 

函数 asctime 返回 一 个 指向 串 的 指针 。 
ctime | 7.12.3.2 函数 ctime 

概述 


#include «time. h> 
char *ctime(const time t *timer); 


说 明 
函数 ctime 把 timer 指向 的 日 历时 间 转 换 为 串 形 式 的 本 地 时 间 ， 它 等 价 于 : 
asctime (localtime (timer)) 
返回 值 
函数 ctime 返回 asctime 把 那个 细 分 时 间作 为 参数 时 返回 的 指针 。 
SR: Å localtime (7.12.3.4). 
gmtime | 7.12.3.3 GA smtime 


概述 
finclude <time.h> 
struct tm *gmtime(const time t *timer); 


说 了 明 

PK Š gmtime 把 timer 指向 的 日 历时 间 转 换 为 以 协调 世界 时 《〈Coordinated Universal 
Time，UTC) 表示 的 细 分 时 间 。 

返回 值 

函数 gmtime 返回 指向 那 种 对 象 的 指针 ， 若 UTC 不 可 用 ， 则 返回 一 个 空 指针 。 
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localtime | 7.12.3.4 函数 localtime 
概述 


#include <time.h> 
struct tm *localtime(const time t *timer); 


说 明 
PR% localtime 把 timer 指向 的 日 历时 间 转 换 为 表示 本 地 时 间 的 细 分 时 间 。 
返回 值 
PRÉC localtime 返回 指向 那个 对 象 的 指针 。 
strftime | 7.12.3.5 Ai strftime 
概述 


#include «time.h» 
size t strftime(char *s, size t maxsize, 
const char *format, const struct tm *timeptr); 


说 明 

函数 strftime 在 format 指向 的 串 的 控制 下 把 字符 放 和 人 s 指向 的 数组 中 。 格 式 应 该 
是 一 个 多 字 节 字符 序列 ， 以 它 初始 的 转移 状态 开始 和 结束 。format 串 由 零 个 或 者 多 个 转 
换 说 明 符 和 普通 多 字 节 字符 组 成 。 转 换 说 明 符 由 一 个 &% 字 符 后 面 跟 一 个 字符 组 成 ， 后 面 
的 这 个 字符 确定 了 转换 说 明 符 的 行为 。 所 有 的 普通 多 字 节 字符 (包括 终止 的 空 字符 ) 都 丝 
毫 不 变 地 复制 到 数组 中 。 如 果 复 制 发 生 在 两 个 重合 的 对 象 中 ， 则 行为 未 定义 。 最 多 可 以 有 
maxsize 个 字符 放置 到 数组 中 。 每 一 个 转换 说 明 符 都 由 下 面 描述 的 适当 字符 代替 。 这 个 适 
当 的 字符 由 当前 区 域 设 置 的 Lo TIME 类 别 和 timeptr 指向 的 结构 中 包含 的 值 确定 。 

"$a" 被 区 域 设 置 的 缩写 星期 名 取代 。 

"BA" 被 区 域 设 置 的 完整 星期 名 取代 。 

“Sb 被 区 域 设 置 的 缩写 月 份 名 取代 。 

"SB" 被 区 域 设置 的 完整 月 份 名 取代 。 

"Sc" 被 区 域 设置 的 适当 的 日 期 和 时 间 表 示 取 代 。 

"sa" 被 表示 为 一 个 十 进 制 数 (01-31) 的 当月 的 第 几 天 取代 。 

"SH" 被 表示 为 一 个 十 进 制 数 (00—23) 的 小 时 时 间 (24 小 时 制 》 取 代 。 

"SI" 被 表示 为 一 个 十 进 制 数 (01-12) 的 小 时 时 间 C12 小 时 制 ) 取代 。 

"%j" 被 表示 为 一 个 十 进 制 数 (001-366) 的 当年 的 第 几 天 取代 。 

"Sm" 被 表示 为 一 个 十 进 制 数 (01-12) 的 月 份 取代 。 

"em" 被 表示 为 一 个 十 进 制 数 〈00-59) 的 分 钟 数 取代 。 

"Sp" 被 区 域 设 置 的 、 与 12 小 时 制 相 关 的 AMPM 指示 符 等 价 的 东西 取代 。 

"&S" 被 表示 为 一 个 十 进 制 数 〈00-61) 的 秒 数 取 代 。 

"SU" 被 表示 为 一 个 十 进 制 数 〈00-53) 的 当年 的 第 几 周 (第 一 个 星期 日 是 第 一 个 星期 
的 第 一 天 ) 取代 。 

"Sw" 被 表示 为 一 个 十 进 制 数 〈0-6) 的 星期 几 取代 ， 星 期 日 表示 为 0。 

"SW" 被 表示 为 一 个 十 进 制 数 (00-53) 的 当年 的 第 几 周 取代 《第 一 个 星期 一 是 第 一 个 
星期 的 第 一 天 )。 

"ox" 被 区 域 设 置 的 适当 的 日 期 表示 取代 。 

"SX" 被 区 域 设 置 的 适当 的 时 间 表 示 取 代 。 

"sy" 被 表示 为 一 个 十 进 制 数 (00-99) 的 不 带 世 纪 的 年 份 取代 。 

"%Y” 被 表示 为 一 个 十 进 制 数 的 带 世 纪 的 年 份 取代 。 
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"SZ" 被 时 区 名 字 或 者 它 的 缩写 取代 ， 如 果 不 能 确定 时 区 ， 则 不 能 被 字符 取代 。 
"SS" Be S 取代。 
如 果 一 个 转换 说 明 符 表 不 是 上 面 中 的 某 一 个 ， 则 行为 未 定义 。 
返回 值 
如 果 包 含 终 止 的 空 字符 在 内 的 结果 字符 的 总 数 不 大 于 maxsize， 则 函数 strftime 返 
回 字符 数 ， 这 些 字 符 被 放 到 s 指向 的 数组 中 但 不 包含 终止 的 空 字符 。 和 否则 ， 珊 数 返 回 零 ， 
且 数 组 的 内 容 不 确定 。 
脚注 
137. tm sec 的 范围 [0, 61] IFA NET. 
138. 要 计算 一 个 程序 化 费 的 时 间 ， 应 该 在 程序 的 开始 调用 clock 函数 ， 然 后 用 后 面 的 
调用 的 返回 值 减 去 它 的 返回 值 。 
139. Alt, tm isdst 的 正 值 或 者 零 会 使 遇 数 mktime 初始 时 认为 夏令 时 对 指定 的 时 间 
分 别 有 效 或 者 无 效 。 一 个 负 值 会 导致 函数 试图 确定 夏令 时 对 指定 的 时 间 是 否 有 效 。 


15.3 <time.h> 的 使 用 
«time.h» 中 声明 的 函数 可 以 确定 用 的 处 理 器 时 间 和 上 日历 时间， 它们 也 可 
以 在 不 同 的 数据 表示 间 进 行 转换 ， 可 以 用 以 下 方式 表示 时 间 。 

O 类 型 clock 上 上 ， 表 示 程 序 使 用 的 处 理 器 时 间 ， 作 为 函数 clock 的 返回 类 型 。 

O 类 型 time +， 表示 日 历时 间 ， 作 为 函数 time 或 者 图 数 mktime 的 返 
器 类 型 。 

O 类 型 double， 用 秒表 示 日 历时 间 ， 作 为 水 数 difftime 的 返回 类 型 。 

O 类 型 struct tn， 表示 分 成 儿 个 独立 的 组 成 部 分 的 日 历时 间 ， 作 为 函 
数 gmtime 和 localtime 的 返回 类 型 。 

Oo 一 个 文本 串 ， 表 示 日 历时 间 ， 作 为 图 数 asctime、ctime 和 strft- 


ime 的 返回 类 型 。 
这 里 的 选择 很 多 ， 最 困难 的 部 分 是 对 一 个 特殊 的 应 用 程序 找 出 想 使 用 的 数据 
表示 和 函数 。 


函数 strftime «time.h» 中 声明 的 一 个 复杂 的 函数 (至 少 从 外 部 来 看 很 复杂 ) 是 
strftime。 它 用 来 在 一 个 格式 串 的 控制 下 ， 从 struct tm 中 产生 - -个 时 间 和 
日 期 的 文本 表示 。 从 这 种 意义 上 说 ， 它 模仿 了 <stdio.h> 中 的 打印 函数 。 它 
在 两 个 重要 的 方面 和 打印 函数 不 同 。 


O strftime 不 接受 可 变 参数 表 。 它 从 一 个 参数 中 就 可 以 获得 所 有 的 时 
间 和 日 期 信息 。 

O strftime 的 行为 在 不 同 的 区 域 设置 之 间 的 变化 很 大 。 例 如 ， 区 域 设 
BP) LC TIME 能 指定 所 有 日 期 的 文本 形式 都 遵循 法 国文 化 的 习惯 。 
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例如 代码 段 

char buf[100); 

strftime (buf, sizeof buf,"%A, %x", localtime(&t0)); 
可 能 把 以 下 任何 一 条 信息 存储 在 but P; 

Sunday, 02 Dec 1979 


dimanche, le 2 décembre 1979 
Weekday 0, 02/12/79 


如 果 想 按照 本 地 习惯 显示 时 间 和 日 期 ， 那 么 strftime 恰好 提供 了 这 种 
灵活 性 。 其 至 可 以 在 转换 说 明 符 之 间 编 写 多 字 节 字符 序列 。 这 就 意味 着 允许 
把 日 期 转换 为 日 文中 的 汉字 和 其 他 的 大 字符 集 。 
转换 说 明 符 下 面 是 strftime 定义 的 转换 说 明 符 ， 每 个 说 明 符 后 面 都 跟 了 一 个 它 产 
生 的 文本 的 例子 。 


Qaaaaaaaaaaaaaaaaaaaau 


$a 缩写 星期 名 (Sun). 

BA 完整 星期 名 (Sunday). 

tb 445 H 4 (Dec). 

SB 完整 月 份 名 (December). 

SC 日 期 和 时 间 (Dec 2 06 : 55: 15 1979), 
sa 当月 第 几 天 02)。 

SH 24 小 时 制 的 一 天 的 小 时 时 间 (06). 

&I 12 小 时 制 的 一 天 的 小 时 时 间 (06)。 

Si ”当年 第 几 天 ， 从 001 开始 (335). 

sm 当年 的 月 份 ， 从 01 开始 (12)。 

SM 小 时 后 的 分 钟 数 (55). 

%p AM/PM 指示 符 (AM)。 

BS 分 钟 后 的 秒 数 (15)。 

su 一 年 的 第 几 周 ， 从 00 开始 ， 以 星期 日 作为 每 一 周 的 第 一 天 ，(48) 。 
sw 星期 几 ，0 为 星期 日 (0) 。 

sw 一 年 的 第 儿 周 ， 从 00 开始 以 星期 一 作为 每 一 周 的 第 一 天 ，(47) 。 
sx 日 期 (Dec 2 1979) 。 

Sx 时 间 (06:55:15), 

sy 本 世纪 的 年 份 ， 年 的 后 两 位 ，00 开始 (79). 
BY 年 份 (1979), 

sz 时 区 名 ， 如 果 有 的 话 (EST) 。 

$t 百 分 号 字符 ”(%) 


我 对 <time.h> 中 定义 的 个 别 的 类 型 和 宏 的 常见 描述 进行 了 总 结 ， 后 面 
还 对 如 何 使 用 «time.h» 中 声明 的 函数 进行 了 简短 说 明 。 
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共享 数据 对 象 


clock t 


asctime 


注意 这 些 函 数 共 享 两 个 静态 数据 对 象 。 所 有 返回 char 型 指针 的 函数 都 返回 
指向 其 中 一 个 数据 对 象 的 指针 。 所 有 返回 struct tm 型 指针 的 函数 都 返回 指向 
为 一 个 数据 对 象 的 指针 。 因 此 ， 对 <time.h> 中 声明 的 一 个 函数 的 调用 可 能 会 
改变 早期 对 男 一 个 (或 者 相同 的 ) 函数 的 调用 存储 的 值 。 如 果 需 要 在 冲突 的 函 
数 调用 间 使 用 这 些 值 ， 那 么 要 小 心地 复制 存储 在 某 个 共享 数据 对 象 中 的 值 。 


NULL — $4 11.3 节 。 


CLOCKS PER SEC—— tk Il clock () /CLOCKS PER SEC 以 秒 为 单位 计算 
了 占用 的 处 理 器 时 间 。 这 个 宏 可 以 是 任何 算术 类 型 ， 整 型 或 浮 点 型 。 如 果 要 
保证 既 可 以 表示 大 范围 的 值 又 可 以 表示 秒 的 小 数 部 分 ， 就 要 把 它 的 类 型 强制 
转换 为 double 类 型 。 

clock_t 一 一 这 是 clock 返回 的 算术 类 型 ，clock 将 在 下 面 说 明 。 该 类 
型 表示 占用 的 处 理 器 时 间 ， 它 可 以 为 整 型 或 者 浮 点 型 ， 但 没有 必要 和 上 面 讲 
的 宏 CLOCKS. PER SEC 的 类 型 相同 。 
参考 11.3 节 。 


time t 一 一 这 是 亏 数 time 返回 的 算术 类 型 ，time KE FW. FIL 
个 «time.h» 中 声明 的 其 他 函数 也 对 这 个 类 型 的 值 进行 操作 。 它 表示 跨越 很 
多 年 ， 很 可 能 到 最 接近 的 一 秒 钟 《虽然 不 一 定 ) 的 日 历时 间 。 不 能 对 这 种 类 
型 的 值 进行 算术 运算 。 

tm 一 一 struct tm 类 型 的 结构 ， 表 示 一 个 “ 细 分 时 间 ” <time.h> 中 声 
明 的 一 些 函 数 对 这 个 类 型 的 值 进行 操作 。 可 以 访问 struct tm 的 某 些 成 员 。 
它 的 定义 类 似 下 面 的 形式 : 


struct tm ( 


size t 


int tm sec; seconds after the minute (from 0) 
int tm min; minutes after the hour (from 0) 
int tm hour; hour of the day (from 0) 

int tm mday; day of the month (from 1) 

int tm mon; month of the year (from 0) 

int tm year; years since 1900 (from 0) 

int tm wday; days since Sunday (from 0) 

int tm yday; day of the year (from 0) 

int tm isdst; DST flag 


这 些 成 员 可 能 会 按照 不 同 的 顺序 排 烈 ， 也 可 能 包含 其 他 的 成 员 。 如 果 夏 令 时 
(DST) 有 效 ， 那 么 DST 标记 大 于 堆 ， 若 无 效 则 DST 标记 等 于 零 ， 若 不 确定 
则 DST 标记 小 于 零 。 不 确定 的 状态 会 促使 函数 读 取 这 种 结构 来 使 它们 自己 确 
XE DST 是 否 有 效 。 

asctime 一 一 (asc RAF ASCII, 现在 看 来 有 点 用 词 不 当 。〉 使 用 这 个 
函数 来 生成 参数 〈 指 向 一 个 细 分 时 间 ) 表示 的 日 期 的 文本 形式 。 这 个 函数 返 
回 一 个 指向 以 空 字 符 结尾 的 字符 串 的 指针 ， 这 种 串 具 有 "sun Dec 2 06 : 
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clock 


difftime 


localtime 


strftime 


55 : 15 1979\n" 这 样 的 形式 。 这 和 在 "C" 区 域 设置 中 用 格式 串 "%a%c\n" 
调用 strftime 等 价 。 如 果 想 得 到 英语 习惯 的 形式 而 不 管 当前 的 区 域 设 
E NMH asctime。 如 果 希 望 得 到 随 区 域 设 置 改变 的 形式 ， 那 么 就 调用 
strftime。 参 考 上 面 讲 的 关于 共享 数据 对 象 的 警告 。 
这 个 函数 计算 占用 的 处 理 器 时 间 而 不 是 日 历时 间 。 如 果 无 法 
得 到 占用 的 处 理 器 时 间 ， 则 返回 -1。 和 否则 ， 每 : -次 调用 都 应 该 返回 -个 等 于 
或 者 大 于 上 一 次 调用 的 值 ， 前 提 是 上 一 次 调用 也 在 这 个 程序 的 执行 过 程 中 。 
这 是 计算 程序 花费 时 间 的 最 好 方法 。 参 考 上 面 描述 的 宏 CLOCKS PER SEC, 

ctime 一 一 ctime (pt) 等 价 于 表达 式 asctime (localtime (pt))。 使 用 这 
个 函数 可 以 把 一 个 日 历时 间 直 接 转换 为 不 受 当前 区 域 设置 限制 的 文本 形式 。 
参考 上 面 讲 的 关于 共享 数据 对 象 的 警告 。 

difftime— iH HH difftime(t1, t0) 是 计算 两 个 时 间 t1 30 co 的 差 值 
的 唯一 安全 的 方法 。 如 果 t1 比 tom, ABR 〈 以 秒 为 单位 ) 是 一 个 正 值 。 

mtime— (m KHF GMT， 现 在 有 点 不 太 准确 了 。) 使 用 这 个 函数 把 
一 个 日 历时 间 转 换 为 分 解 的 UTC 时 间 。 成 员 tm isdst 应 当 为 零 。 如 果 想 得 
到 本 地 时 间 ， 使 用 下 面 的 函数 1ocaltime。 参 考 上 面 关 于 共享 数据 对 象 的 警告 。 

localtime 一 一 使 用 这 个 函数 把 一 个 日 历时 间 转 换 为 分 解 的 本 地 时 间 。 
成 员 tm isdst 应 该 能 反映 系统 关于 这 个 时 间 和 日 期 的 夏令 时 所 能 提供 的 一 
切 信 息 。 如 果 想 获得 UTC 时间， 使 用 上 面 的 函数 gmtime。 参 考 上 面 关 于 共 
享 数据 对 象 的 警告 。 

mktime— 一 这 个 函数 首先 把 它 的 参数 〈 一 个 细 分 时 间 ) 转化 为 规范 的 形 
式 。 例 如 ， 它 可 以 把 秒 数 添加 到 细 分 时 间 的 成 员 tm sec 中 。 这 个 函数 一 次 
从 tm sec 中 减 去 60， 并 使 tm_min 增 1， 直 到 tm sec 在 [0, 59] 的 范围 内 。 
然后 这 个 函数 用 相似 的 方式 校正 tm_min， 接 着 是 每 一 个 较 粗 烟 的 时 间 划 分 直 
到 tm year。 它 从 其 他 的 部 分 确定 tm_wday 和 tm_yday。 很 明显 ， 也 可 以 使 
用 分 钟 、 小 时 、 天 、 月 或 者 年 来 改变 一 个 细 分 时 间 。 

然后 mktime 把 这 个 细 分 时 间 转 换 为 一 个 等 价 的 日 历时 间 。 它 假设 这 
个 细 分 时 间 表 示 一 个 本 地 时 间 。 如 果 成 员 tm isdst 比 零 小 ， 函 数 就 要 尽 
量 确 定 夏 令 时 是 否 对 这 个 特定 的 时 间 和 日 期 有 效 。 否 则 ， 它 就 保留 这 个 标 
志 的 原始 状态 。 因 此 ， 修 改 一 个 日 历时 间 的 唯一 可 靠 的 方法 就 是 通过 调用 
localtime 把 它 转换 为 一 个 细 分 时 间 ， 再 修改 - :下 适当 的 成 员 ， 然 后 通过 调 
用 mktime 把 结果 转换 回 一 个 日 历时 间 。 

strftime 一 一 这 个 函数 生成 一 个 空 字 符 结尾 的 文本 串 ， 这 个 串 包含 了 指 
定 的 时 间 和 日 期 信息 。 编 写 一 个 格式 串 参 数 来 指定 字面 量 文 本 和 转换 后 的 时 
间 和 日 期 的 混合 体 。 指 定 一 个 细 分 时 间 来 提供 编码 的 时 间 和 日 期 信息 。 当 前 
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区 域 设置 中 的 类 别 LC. TIME 决定 了 每 一 次 转换 的 行为 。 我 从 本 节 的 “转换 说 
明 符 ” 部 分 开始 描述 了 怎样 写 格式 串 。 参 考 上 面 关于 共享 数据 对 象 的 警告 。 


time 一 一 这 个 函数 确定 当前 的 日 历时 间 。 如 果 不 能 获得 当前 日 历时 间 ， 
则 返回 -1。 否 则 ， 每 一 次 调用 都 应 该 返回 和 上 一 次 调用 相同 或 者 比 上 一 次 调 
用 晚 的 时 间 ， 前 提 是 这 些 调用 是 在 同一 个 程序 的 执行 过 程 中 。 该 函数 是 获得 
当前 时 间 和 日 期 的 最 好 方式 。 


15.4 <time.h> 的 实现 


头 文件 


«time.h» 


«time.h» 中 声明 的 函数 多 种 多 样 。 很 多 函数 都 要 努力 处 理 计算 和 表示 时 
间 和 日 期 时 涉及 的 很 多 奇异 的 无 规则 的 情况 。 要 了 解 各 种 编码 技术 。 


图 15-1 显示 了 文件 time.h。 和 往常 一 样 ， 它 从 内 部 头 文件 <yvals.h> 
中 继 关 了 一 些 标准 头 文件 中 重复 使 用 的 定义 。 第 11 章 讨 论 了 宏 NOLL 和 类 型 
size t 定义 的 实现 。 


«yvals.h» 也 定义 了 两 个 描述 基本 函数 clock 和 time DIE, 


C) % _cps 指定 了 宏 CLOCKS PER SEC 的 值 ; 
O E TBIAS 给 出 了 time 的 返回 值 和 从 1900 年 1 月 1 日 起 计算 得 到 的 
值 之 间 的 差 值 ， 该 值 以 秒 为 单位 。(<time.h> 中 没有 这 个 宏 名 。) 


/* time.h standard header */ 
#ifndef TIME 

#define TIME 

#ifndef | YVALS 

include «yvals.h» 

#endif 


/* macros */ 
#define NULL | NULL 
#define CLOCKS PER SEC CPS 
/* type definitions */ 
#ifndef  SIZET 
#define _SIZET 
typedef _Sizet size_t; 


fendif 
typedef unsigned int clock t; 
typedef unsigned long time t; 
struct tm ( 

int tm sec; 

int tm min; 

int tm hour; 

int tm mday; 

int tm mon; 

int tm year; 

int tm wday; 

int tm yday; 
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函数 time 


函数 clock 


int tm isdst; 
li 
/* declarations */ 
char *asctime (const struct tm *); 
clock t clock (void); 
char *ctime(const time t *); 
double difftime (time t, time t); 
struct tm *gmtime(const time t *); 
struct tm *localtime(const time t *); 
time t mktime(struct tm *); 
size t strftime(char *, size t, const char *, 
const struct tm *); 
time t time(time t *); 
#endif 口 


这 些 宏 的 值 很 大 程度 上 依赖 clock WI time 的 实现 方式 。 这 个 实现 
用 unsigned int (clock 上 类 型 ) 来 表示 占用 的 处 理 器 时 间 。 同 时 ， 它 用 
unsigned long (time t 类型) 表示 日 历时 间 ， 这 个 日 历时 间 从 1900 £ 1 Å 
1 日 起 对 UTC 秒 数 进行 计数 ， 可 以 表示 从 1900 至 少 到 2036 年 的 日 期 。 不 管 
系统 提供 的 是 什么 ， 都 必须 对 它 进 行 调整 使 它 和 这 些 习惯 相 匹配 。 


d TBIAS 是 一 个 权宜 之 计 ， 一 般 情况 下 设 为 零 。 用 户 提 供 的 time 版 本 
应 该 用 一 个 合适 的 起 点 来 传递 日 历时 间 。 然 而 ，UNIX 以 秒 为 单位 从 1970 年 1 
Al 日 开始 计算 时 间 。 很 多 C 的 实现 都 提供 遵循 这 种 习惯 的 time 函数 。 如 果 
直接 使 用 这 样 的 time 函数 很 方便 ， 那 么 «yvals.h» 应 该 包含 下 面 的 定义 : 

#define _TBIAS ((70 * 365LU + 17 ) * 86400 

这 个 表达 式 计 算 了 70 年 ， 包 含 TE 4E SR RAT EA Z 18] Å it gl 
差 。 在 某 些 地 方 ，<time.h> 中 声明 的 函数 通过 加 上 或 者 减 去 TBIAS 来 调整 
time t 类 型 的 值 。 


图 15-2 显示 了 文件 time.c， 它 定义 了 UNIX 系统 的 函数 time, AER 
一 样 ， 我 假设 存在 一 个 使 用 保留 名 字 的 C 可 调用 函数 ， 这 个 函数 执行 UNIX 
系统 服务 。 对 这 个 版 本 的 time 函数 ， 头 文件 <yvals.h> WT LAIR _TBIAS 定 
LAF. . 

UNIX 也 为 函数 clock 提供 了 一 个 精确 的 替代 函数 。 很 多 C 实现 也 模 
fj UNIX 这 样 做 。 因 此 ， 用 户 可 能 不 需要 做 额外 的 工作 ， 只 要 适当 地 定义 宏 
_CPS 就 行 了 。 例 如 ， 对 于 一 个 PC 兼容 机 ， 这 个 值 大 约 是 18.2。 


图 15-3 显示 了 文件 clock.c， 它 定义 了 clock 的 一 个 版 本 ， 如 果 操 作 系 
统 不 提供 独立 地 计算 占用 的 处 理 器 时 间 的 服务 ， 可 以 使 用 它 。 这 个 函数 只 是 
返回 一 个 截 短 版 本 的 日 历时 间 。 这 种 情况 下 ， 头 文件 <yvals.h> 把 宏 _CPS 
FV Å I. 
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clock.c 


图 15-4 
difftime.c 


函数 difftime 


头 文件 


"xtime.h" 


/* time function -- UNIX version */ 
#include «time.h» 


/* UNIX system call */ 
time t Time(time t *); 


time t (time)(time t *tod) 


{ /* return calendar time */ 
time t t - Time(NULL) + (70*365LU+17) *86400; 
if (tod) 
*tod - t; 
return (t); 
Lo? d 


/* clock function -- simple version */ 
#include «time.h» 


clock t (clock) (void) 


{ /* return CPU time */ 
return ((clock t)time(NULL)):; 
) 口 


/* difftime function */ 
#include «time.h» 


double (difftime)(time t tl, time t t0) 


( /* compute difference in times */ 
tO -= TBIAS, tl -= _TBIAS; 
return (t0 <= tl ? (double) (tl - tO) : -(double)(tO - t1)); 


) 


图 15-4 显示 了 文件 Gifftime.c。 在 比较 两 个 时 间 之 前 ， 它 要 小 心地 纠 
正 两 个 时 间 的 偏差 。 它 也 要 小 心地 生成 两 个 无 符号 整数 值 之 间 的 有 符号 的 差 
值 。 注 意 函数 是 怎样 把 差 值 t1-to 在 转换 为 double 类 型 之 后 就 取 反 的 。 


剩 下 的 函数 都 包含 内 部 头 文件 "xtime.h"。 图 15-5 显示 了 文件 xtime. 
h， 它 包含 了 标准 头 文件 <time.h> 和 内 部 头 文件 "xtinfo.h"。( 参 考 64 节 
的 文件 "xtinfo.h".) 那个 内 部 头 文件 定义 了 _Tinfo 类 型 ， 也 声明 了 asc- 
time.c 中 定义 的 数据 对 象 _Times。( 参 考 15.4 节 。) Times 指定 了 LC TIME 
类 别 的 特定 于 区 域 设 置 的 信息 。 


ARX "xtime.h" 定义 了 宏 WPAY， 这 个 宏 为 1900 年 1 月 1 日 指定 了 周 
日 以 外 的 某 一 天 (星期 --)。 该 文件 定义 了 Dstrule 类 型 ， 这 种 类 型 指定 了 
确定 夏令 时 编码 规则 的 备 个 组 成 部 分 。( 参 考 图 15-9 开始 的 文件 xgetdst. 
Co) 它 也 声明 了 实现 这 个 版 本 的 <time.h> 的 各 种 内 部 头 文件 。 
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网 15-5 
xtime.h 

图 15-6 
gmtime.c 
EET gmtime 


2 


Gët _Ttotm 


= 


函数 Daysto 


/* xtime. h internal header */ 
#include <time.h> 
finclude "xtinfo.h" 
/* macros */ 
#define WDAY 1 /* to get day of week right * / 
/* type definitions */ 
typedef struct ( 
unsigned char wday, hour, day, mon, year; 
) Dstrule; 
/* internal declarations */ 
int _Daysto(int, int); 
const char *_Gentime(const struct tm *, _Tinfo *, 
const char *, int *, char *); 
Dstrule *_Getdst (const char *); 
const char *_Gettime(const char *, int, int*); 
int _Isdst(const struct tm *); 
const char *_Getzone (void); 
size_t _Strftime(char *, size_t, const char *, 
const struct tm *, _Tinfo *); 
struct tm *_Ttotm (struct tm *, time_t, int); 
time_t _Tzoff (void); 口 


/* gmtime function */ 
#include "xtime.h" 


struct tm *(gmtime)(const time t *tod) 
{ /* convert to Greenwich Mean Time (UTC) */ 
return (_Ttotm(NULL, *tod, 0)); 
} 


— Hj 

图 15-6 显示 了 文件 gmtime.c, PÅ gmtime 是 把 用 秒表 示 的 日 历时 间 
(time t 类 型 ) 转换 为 -个 细 分 时 间 (struct tm 类 型 ) 的 两 个 函数 中 较 简 
单 的 一 个 。 它 只 调用 内 部 函数 _Ttotm。 第 一 个 参数 是 . -个 空 指针 ， 它 告诉 
Ttotm 把 细 分 时 间 存 储 在 公共 的 静态 数据 对 象 中 。 第 三 个 参数 是 穹 ， 它 强调 
夏令 时 无 效 。 

图 15-7 显示 了 文件 xttotm.c, HE MT MAM _Ttotm， 这 个 函数 承担 
了 把 秒 转换 为 年 、 月 、 日 等 等 这 些 繁琐 的 操作 。 这 个 文件 也 定义 了 _Daysto， 
_Ttotm 和 其 他 的 函数 用 它 来 进行 日 历 计算 。 


_Daysto 要 计算 每 年 365 天 之 外 的 天 数 。 因 此 ， 它 必须 确定 指定 的 年 份 
和 1900 年 之 问 有 多 少 羡 和 年。 函数 也 计算 从 一 年 的 开始 到 指定 月 份 的 额外 天 
数 。 为 了 实现 这 一 点 ， 有 时 它 还 要 确定 当前 的 年 份 是 不 是 头 年 。 函 数 可 以 识 
别 1900 FRERE. ERDA 1800 年 和 它 之 前 的 非 国 年 担心 ， 或 者 2100 
年 及 其 以 后 的 年 份 。( 即 使 如 此 ， 只 是 在 这 两 个 界限 之 间 的 几 十 年 之 内 也 会 
产生 其 他 的 问题 。) 


^x 
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图 15-7 


xttotm.c 


#include "xtime.h" 


/* macros */ 


#define MONTAB (year) N 

((year) & 03 || (year) -- 0 ? mos lmos) 
/* static data */ 

static const short lmos[] = (0, 31, 60, 91, 121, 152, 
182, 213, 244, 274, 305, 335); 

static const short mos[] - (0, 31, 59, 90, 120, 151, 
181, 212, 243, 273, 304, 334); 

int _Daysto(int year, int mon) 


{ 


int days; 

if (0 < year) /* correct for leap year: 1801-2099 */ 
days = (year - 1) / 4; 

else if (year <= -4) 
days = 1+ (4 - year) / 4; 

else 
days = 0; 


/* _Ttotm and _Daysto functions */ 


/* compute extra days to start of month */ 


return (days + MONTAB (year) [mon]); 


) 


struct tm * Ttotm(struct 
( 
int year; 
long days; 
time t secs; 
static struct tm ts; 


secsarg += | TBIAS; 
if (t -- NULL) 
t = kts; 
t-»tm isdst - isdst; 
for (secs - secsarg; 
{ 
days = 
t->tm_wday = 
{ 


tm *t, time_t secsarg, int isdst) 
/* convert scalar time to time structure */ 


secsarg + 3600) 
/* loop to correct for DST */ 


; secs = 


secs / 86400; 
(days + WDAY) 


% 7; 
/* determine year */ 


long i; 
for (year = days / 365; 
days < (i = _Daysto(year, 0) + 365L * year); ) 
--year; /* correct guess and recheck */ 
days -= i; 
t->tm_year = year; 
t->tm_yday = days; 


} 
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( /* determine month */ 
int mon; 


const short *pm - MONTAB (year); 
for (mon - 12; days « pm[--mon]; ) 


t->tm mon = mon; 

t->tm mday - days - pm[mon] + 1; 
) 

secs %= 86400; 

t->tm hour = secs / 3600; 

secs %= 3600; 


t->tm min = secs / 60; 
t->tm sec - secs $ 60; 
if (0 <= t-»tm isdst || (t-»tm isdst =  Isdst(t)) <= 0) 
return (t); /* loop only if «0 -» 1 */ 
} 
} D 


Daysto 要 处 理 1900 年 以 前 的 年 份 ， 只 是 因为 函数 mktime 可 以 产生 那 
个 范围 的 中 间 日 期 并 且 生 成 一 个 可 以 表示 的 time_t 类 型 的 值 。( 例 如 ， 可 以 
从 2000 年 开始 ， 后 退 2 000 个 月 ， 再 前 进 20 亿 秒 。) 无 论 参 数值 是 多 少 ， 这 
种 方法 都 能 小 心地 避免 整数 溢出 。 这 个 函数 也 计算 多 余 的 天 数 而 不 是 全 部 的 
天 数 ， 所 以 它 可 以 在 不 必 担 心 结 果 滋 出 的 前 提 下 覆盖 一 个 更 大 范围 的 年 份 。 


-Ttotm 使 用 Daysto 确定 和 它 的 时 间 参 数 secsarg 对 应 的 年 份 。 因 为 
_Daysto 的 反 函 数 不 容 易 实现 ， 所 以 _Ttotm 就 不 断 地 猜测 并 迭代 。 在 最 坏 
的 情况 下 ， 它 必须 后 退 一 年 来 验证 它 的 猜测 。 这 两 个 函数 都 使 用 文件 的 最 上 
面 定义 的 宏 MONTAB 来 确定 一 个 指定 的 月 份 开 始 之 前 的 天 数 。 这 个 宏 也 假设 
除了 1900 之 外 ， 每 4 年 是 一 个 头 年 。 


_Ttotm 的 ijsdst (第 三 个 ) 参数 遵守 对 struct tm 的 成 员 isdst 
的 约定 : 


D 如 果 isast 比 零 大 ， 则 夏令 时 一 定 有 效 。_Ttotm 认为 它 的 调用 者 已 
经 对 时 间 参 数 secsarg 作 了 任何 必要 的 调整 。 

O 如 果 isdst 是 零 ， 则 夏令 时 一 定 无 效 。_Ttotm 认 为 没有 必要 对 时 间 
参数 secsarg 进行 调整 。 

O 如 果 isast 比 零 小 ， 调 用 者 不 知道 夏令 时 是 否 有 效 。_Ttotm 应 该 努 
力 找 出 结果 。 如 果 这 个 函数 确定 夏令 时 有 效 ， 它 就 把 时 间 提 前 一 个 小 
时 《3 600 秒 ) 并 且 重 新 计算 细 分 时 间 。 


因此 ，_Ttotm 将 最 多 循环 一 次 。 只 有 当 它 需要 确定 是 否 需要 循环 的 时 候 它 


环 。 


才 调 用 函数 _Isdst。 即 使 这 样 ， 它 也 只 在 _Isdst 断定 夏令 时 有 效 的 时 候 循 EH 
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函数 Isdst 


EET Getdst 


函数 localtime 


FÅ Tzoff 


图 15-8 显示 了 文件 xisdst.c， 函 数 Isast 确定 夏令 时 的 状态 。_Times 
Jeder 指向 一 个 说 明 规 则 的 字符 串 。( 参 考 图 15-16 文件 asctime.c 中 
Times 的 定义 ， 参 考 6.4 节 对 规则 字符 串 的 描述 。) 

Isdst 使 用 编码 形式 的 规则 工作 。 那 些 规则 在 用 户 第 - -次 调用 函数 的 时 
候 或 者 区 域 设 置 的 变动 改变 了 串 Times. Isåst 的 最 后 的 编码 版 本 时 不 是 现 
成 的 。 如 朵 那个 串 是 空 的 ，_Isqst 就 去 找 附 加 在 时 区 信息 Times. Tzone 
后 面 的 规则 。 它 必须 调用 Getzone 来 获得 时 区 信息 。 它 调用 _Gettime 来 确 
定 所 有 夏令 时 规则 的 开头 。 如 果 可 能 的 话 ， 函 数 Getdst 然后 对 当前 的 规则 
数组 进行 编码 。 

给 定 - -个 编码 的 规则 数组 ，_Isdst 扫描 数组 来 寻找 包含 相关 年 份 的 规 
则 。 它 调整 由 任何 工作 日 ( 除 周 日 以 外 ) 的 限制 规则 指定 的 天 ， 然 后 把 规则 
时 间 和 正在 测试 的 时 间 相 比较 。 注 意 ， 对 一 个 指定 的 开始 年 份 ， 第 一 -个 规则 
开始 时 不 在 DST 中 。 同 样 的 年 份 的 后 继 规则 也 不 - 定 在 DST 中 。 

图 15-9 显示 了 文件 xgetdst.c。 它 定义 了 函数 _Getdst， 这 个 函数 分 析 
_Times._Isdst 指向 的 字符 串 来 构建 规则 数组 。 一 个 〈 非 空 ) 的 字符 串 的 第 
一 个 字符 作为 一 个 区 域 界定 符 ， 和 其 他 提供 特定 区 域 设 置 的 时 间 信 息 的 串 一 
起 起 作用 。 这 个 函数 首先 对 这 些 界 定 符 计 数 ， 以 使 它 可 以 分 配 数组 。 接 着 它 
再 一 次 传递 这 个 字符 串 来 对 每 个 独立 的 域 进行 分 析 和 检查 。 

_Getdst 调用 内 部 函数 getint 来 使 用 一 个 规则 转换 整 型 子 域 。 因 为 这 
些 域 中 林 存 在 大 到 可 以 造成 溢出 的 情况 ， 所 以 没有 溢出 检查 。 这 里 的 逻辑 和 
_Getdst 本 身 的 逻辑 都 有 点 见长， 但 简单 易 懂 。 

图 15-10 显示 了 文件 localtim.c. PÅ localtime få gmtime 一 样 调用 
_Ttotm。 然 而 ， 这 里 ，1localtime MRE MAE UTC 时 间 转 换 为 本 地 时 间 。 


”要 做 到 这 一 点 ， 这 个 函数 必须 以 秒 为 单位 计算 出 UTC 和 本 地 时 区 的 时 间 凑 。 


文件 localtim.c 也 定义 了 函数 _Tzoff， 这 个 函数 努力 确定 这 个 时 间 差 
(tzoff， 以 分 钟 为 单位 ，。 当 用 户 第 一 次 调用 函数 时 或 区 域 设 置 的 变动 改变 
T & Times. Isdst 最 后 的 编码 版 本 时 ， 这 个 时 间 差 不 是 当前 的 。 如 果 那 个 
串 是 空 的 ， 则 _Tzoff 调用 函数 Getzone 来 从 环境 变量 中 确定 时 间 差 (如 果 
可 能 的 话 )。 

无 论 是 怎样 获得 的 ， 串 Times. Tzone 的 形式 都 为 :EST:EDT:+0300。 
(参考 64 节 。) Tzoff 调用 函数 _Gettime 来 确定 第 三 个 域 《#2， 从 零 开始 
计数 ) 的 起 始 位 置 (p) 和 长 度 (n). <stdlib.h> 中 声明 的 前 数 strtol 一 定 
要 完全 分 析 这 个 域 来 把 它 转换 为 一 个 编码 的 整数 。 而 且 ， 这 个 数 不 能 完全 没 
有 意义 。( 最 大 的 数 比 12*60 大 ， 因 为 国际 日 期 变更 线 的 两 边 都 存在 一 些 特 
殊 的 时 区 5 ) 
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图 15-8 


xisdst.c 


/* _Isdst function */ 
#include <stdlib.h> 
finclude "xtime.h", 


int  Isdst(const struct tm *t) 


{ /* test whether Daylight Savings Time in effect */ 
Dstrule *pr; ` 
static const char *olddst = NULL; 
static Dstrule *rules = NULL; 
if (olddst ! = Times. Isdst) 
{ /* find current dst rules */ 
if ( Times. Isdst[0] == ‘\0') 
( /* look beyond time zone info */ 
int n; 
if ( Times. Tzone[0] == "N0") 
Times. Tzone = Getzone(); 
Times. Isdst = Gettime( Times. Tzone, 3, &n); 
if ( Times. Isdst[0] != 'N0") 
-- Times. Isdst; /* point to delimiter */ 
) 
if' ((pr =  Getdst( Times. Isdst)) == NULL) 
return (-1); 
free (rules); 
rules - pr; 
olddst - Times. Isdst; 
) 
{ /* check time against rules */ 
int ans = 0; 


const int do 
const int hour 


_Daysto(t->tm_year, 0); 
t->tm_hour + 24 * t->tm_yday; 


const int wad (365L * t-»tm year + d0 + WDAY) $ 7 + 14; 


for (pr = rules; pr-»wday !- (unsigned char)-1; ++pr) 
if (pr->year <= t->tm year) ` 
{ /* found early enough year */ 
int rday = _Daysto(t->tm_year, pr->mon) - d0 
.+ pr->day; 
if (0 < pr->wday) 
{ /* shift to specific weekday */ 
int wd = (rday + wd0 - pr->wday) % 7; 
rday += wd == 0 ? 0 7 - wd; 
if (pr->wday <= 7) . 
rday -= 7; /* strictly before */ 
) 
if (hour < rday * 24 + pr->hour) 
return (ans); 
ans = pr->year == (pr + 1)->year ? !ans 0; 
) 
return (ans) ; 


| (15 
) (m 


430 


€ 15% <time.h> 


图 15-9 
xgetdst.c 


/* Getdst function */ 
#include <ctype.h> 
#include <stdlib.h> 
#include <string.h> 
#include "xtime.h" 


static int getint (const char *s, 


int n) 


{ /* accumulate digits */ 
int value; 


for (value = 0; 0 <= --n && isdigit(*s); ++s) 
value = value * 10 + *s - '0'; 
return (0 <= n ? -1 : value); 


) 


Dstrule * Getdst(const char *s) 
[ /* parse DST rules */ 
const char delim = *s-**; 

Dstrule *pr, *rules; 


if (delim == 'N0") 


return (NULL); 
{ /* buy space for rules */ 
const char *sl, *s2; 
int i; 


for (si = s, i = 2; (s2 = strchr(sl, delim)) != NULL; ++i) 
si = s2 + 1; 
if ((rules = malloc (sizeof (Dstrule) * i)) == NULL) 
return (NULL); 


} 
{ /* parse rules */ 
int year = 0; 


for (pr = rules; ; ++pr, ++5) 
{ /* parse next rule */ 

if (*s == '(') 
{ /* got a year qualifier */ 


year = getint(s + 1, 4) - 1900; 
if (year < 0 || s[5] != ')") 
break; /* invalid year */ 
s += 6; 
} 


pr->year = year; 
pr->mon = getint(s, 2) - 1, S 
pr->day = getint(s, 2) - 1, s += 2; 
if (isdigit(*s)) 
pr->hour = getint(s, 2), S += 2; 
else 
pr->hour = 0; 
if (12 <= pr->mon || 99 < pr->day || 99 < pr->hour) 
break; /* invalid month, day, or hour */ 
if (*s ls "rr && *s !- '- ' ) 
pr->wday = 0; 
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图 15-9 else if (s[1] < < s[1]) 
(4) break; /* invalid week day 
else 
H /* compute week day field 
pr->wday = s[i] ? 7 : s[1] - '0'; 
if (*s == "+") /* '-' : strictly before 
pr-»wday += 7; /* '*' : on or after 
S += 2; 
H 
if (*s == '\0’) 
{ /* done, terminate list 
(pr + 1)->wday (unsigned char) -1; 
(pr + 1)->year year; 
return (rules); 
} 
else if (*s != delim) 
break; 
} 
free(rules); 
return (NULL); 
) 
) 
图 15-10 


/* localtime function */ 
localtim.c #include <stdlib.h> 
#include "xtime.h" 


time t  Tzoff (void) 


{ /* determine local time offset */ 
static const char *oldzone = NULL; 

static long tzoff = 0; 

static const long maxtz = 60*13; 


if (oldzone != _Times._Tzone) 
{ /* determine time zone offset */ 
const char *p, *pe; 
int n; 


if ( Times. Tzone [0] ==" NO") 
Times. Tzone =  Getzone(); 
p = Gettime( Times. Tzone, 2, &n); 
tzoff = strtol(p, (char **)&pe, 10); 
if (pe -p !-n 
|| tzoff <= -maxtz || maxtz <= tzoff) 
tzoff - 0; 
oldzone - Times. Tzone; 
) 
return (tzoff * 60); 
} 


struct tm *(localtime) (const time t *tod) 


{ /* convert to local time structure */ 
return (_Ttotm(NULL, *tod + Tzoff(), -1)); 


} o 
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图 15-11 


xgettime.c 


函数 Gettime 


函数 _Getzone 


"TIMEZONE" 
"TZ n 


EA mktime 


/* _Gettime function */ 
#include <string.h> 
#include "xtime.h" 


const char *_Gettime(const char *s, int n, int *len) 
{ /* get time info from environment */ 
const char delim = *s ? *s++ : '\OQ'; ` 
const char *s1; 


for (; ; --n, s = s1 + 1) 
{ : /* find end of current field */ 
if ((sl = strchr(s, delim)) == NULL) 
si = s + strlen(s); 
if (n <= 0) 
{ /* found proper field */ 
*len = sl - s; 


return (s); 
} 
else if (*sl == '\0') 
{ /* not enough fields */ 
*len = 1; 
return (s1); 


} 


Ad 15-11 显示 了 文件 xgettime.c。 它 定义 了 函数 _Gettime， 这 个 函数 
对 一 个 串 中 的 域 进行 定位 ， 该 串 指 定 了 特定 于 区 域 设置 的 时 间 人 信息。 参考 
上 面 对 Getdst 的 描述 ， 就 会 知道 Gettime 怎样 解释 域 界定 符 了 。 如 果 
_Gettime 不 能 找到 要 求 的 域 ， 它 就 返回 一 个 指向 空 串 的 指针 。 

15-12 显示 了 文件 xgetzone.c. MÅ Getzone 调用 <stdlib.h> 中 
声明 的 函数 getenv 来 确定 环境 变量 "TIMEZONE" 的 值 ， 这 个 值 应 该 和 和 上面 描 
述 的 特定 于 区 域 设 置 的 时 间 串 _Times._Tzone 格式 相同 。( 可 能 会 使 用 用 来 
决定 夏令 时 的 规则 ) 

如 果 "TIMEZONE" AA NTE, PÅ BE Getzone 就 会 去 寻找 环境 变量 
"TZ", 1X f£ B iE UNIX 格式 ESTOSETD. W WE pk Å reformat 使 用 
"TZ" 的 值 在 静态 缓冲 区 中 生成 一 种 更 合适 的 形式 。 

如 果 _Getzone 不 能 找到 这 两 个 环境 变量 中 的 任何 一 个 ， 它 就 认为 本 地 
时 区 为 UTC。 在 任何 情况 下 ， 它 都 把 它 的 决定 存储 在 内 部 静态 缓冲 区 tzone 
中 。 对 这 个 函数 的 后 续 调用 返回 这 个 记录 的 值 。 因 此 ， 环 境 变量 最 多 被 查询 
一 次 ， 就 是 Getzone 第 一 次 调用 的 那 一 次 。 

图 15-13 显示 了 文件 mktime.c, MÅ mktime 从 细 分 时 间 struct tm 中 
计算 一 个 整数 cime 上。 它 不 遗 余力 地 避免 计算 过 程 中 的 溢出 。( 如 果 时 间 不 
能 被 正确 地 表示 ， 这 个 函数 就 被 迫 返 回 值 -1。) 
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图 15-12 


xgetzone.c 


/* Getzone function */ 
#include «ctype.h» 
#include <stdlib.h> 
#include <string.h> 
finclude "xtime.h" 


/* static data */ 
static const char *defzone = 
static char *tzone = NULL; 


static char *reformat 
{ 
int i, val; 
static char tzbuf[] = 


(const char *s) 


for (i = 4; 1 <= --i; ) 
if (isalpha(*s)) 
tzbuf[i] = 
else 
return (NULL); 
tzbuf[9] = *s == '-' || *s == '+' 
if (!isdigit(*s)) 
return (NULL); 
val = *s++ - '0% 
if (isdigit(*s)) 
val = 10 *val + *st++ 一 
(val *= 60, i = 14; 
tzbuf[i] = val % 10; 
(i = 8; S <= --i; ) 
if (isalpha(*s)) 
tzbuf[i] = 


*Stt; 


'O'; 


for 10 <= --i; 


for 


*S4++; 
else 
return (NULL); 
return (*s == '\0' ? tzbuf 


} 


NULL) ; 


const char *_Getzone (void) 


":UTC:UTC:0"; 


":EST: EDT: +0300"; 


val /= 10) 


/* reformat TZ */ 


{ /* get time zone information */ 


const char *s; 


if (tzone) 
else if 
{ 
if ((tzone = malloc(strlen(s) 
strepy (tzone, s); 


((s = getenv ("TIMEZONE") ) 


} 
else if ((s'= getenv("TZ")) 
tzone = reformat (s); 

if (tzone == NULL) 
tzone = (char *)defzone; 
return (tzone); 


) 


!= NULL) 


+ 1)) 


!= NULL) 


/* copy desired format */ 
!= NULL) 


sg] 
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/* mktime function */ 
mktime.c #include «limits.h» 
finclude "xtime.h" 


time t (mktime) (struct tm *t) 


{ /* convert local time structure to scalar time 
double dsecs; 


int mon, year, ymon; 
time t secs; 


ymon - t-»tm mon / 12; 

mon = t-»tm mon - ymon * 12; 

if (mon « 0) 
mon += 12, --ymon; 

if (ymon « 0 && t->tm year « INT MIN - ymon 
|| 0 < ymon && INT MAX - ymon < t->tm year) 
return ((time t)(-1)); 

year - t->tm year + ymon; 

dsecs - 86400.0 * ( Daysto(year, mon) - 1) 
+ 31536000.0 * year + 86400.0 * t-»tm mday; 

dsecs += 3600.0 * t->tm hour + 60.0 * t-»tm min 
+ (double)t->tm sec; 

if (dsecs < 0.0 || (double) (time t)(-1) <= dsecs) 
return ((time t)(-1)); 

secs - (time t)dsecs -  TBIAS; 

_Ttotm(t, secs, t->tmisdst); 

if (0 < t->tm isdst) 
secs -= 3600; 

return (secs -  Tzoff()); 


} 
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ctime.c 


/* ctime function */ 
#include <time.h> 


char * (ctime) (const time t Stodi 
{ /* convert calendar time to local text */ 
return (asctime(localtime(tod))); 


} 口 


图 15-15 /* strftime function */ 
strftime.c #include "xtime.h" 


size t (strftime)(char *s, size t n, const char *fmt, 
const struct tm *t) 
{ /* format time to string */ 
return (_Strftime(s, n, fmt, t, &_Times)); 


} Oo 


Él 15-16 
asctime.c 
时 间 格 式 化 
函数 

函数 asctime 
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/* asctime function */ 
#include "xtime.h" 


/* static data */ 
static const char ampm[] = (":AM:PM"); 
static const char days[] = { 
":Sun: Sunday : Mon : Monday : Tue: Tuesday : Wed : Wednesday" 
":Thu:Thursday:Fri:Friday:Sat:Saturday"); 


static const char fmts[] = ( 

"|%b $D $H:€$M:*S %Y|%b YD $Y|*$H:*M:$S"); 
Static const char isdst[] = {""}; 
Static const char mons[] = I 


";Jan:January:Feb:February:Mar:March" 
":Apr:April:May:May: Jun: June" 
":Jul:July:Aug:August:Sep:September" 

" :Oct:October:Nov:November : Dec : December"); 


Static const char zone[] = (""); /* adapt by default */ 
Static  Tinfo ctinfo = {ampm, days, fmts, isdst, mons, zone); 
_Tinfo Times = {ampm, days, fmts, isdst, mons, zone); 


char *(asctime)(const struct tm *t) 


t /* format time as "Day Mon dd hh:mm:ss yyyy\n" */ 
static char tbuf[] = "Day Mon dd hh:mm:ss yyyy\n"; 
_Strftime(tbuf, sizeof (tbuf), "%a %c\n", t, &ctinfo); 

return (tbuf); 

} a 


mktime 的 第 一 部 分 确定 年 份 和 月 份 。 如 果 它 们 能 作为 int 型 值 表 示 ， 这 
个 函数 就 调用 _Daysto 来 校正 从 1900 年 以 来 的 半天 数 ， 然 后 以 秒 为 单位 累 
加 出 double 型 的 时 间 ， 以 使 整数 溢出 的 可 能 性 降 到 最 小 。 如 果 最 后 的 值 可 以 
Fl time t 类 型 表示 ， 函 数 就 把 它 转 换 为 这 种 类 型 。mktime 调用 Ttotm 以 
使 细 分 时 间 规 范 化 。 最 后 ， 函 数 为 夏令 时 校正 时 间 ， 并 把 它 从 本 地 时 间 转 换 
为 UTC。( 最 后 的 代码 读 起 来 要 比 编写 它 简 单 得 多 。) 


«time.h» 中 声明 的 剩余 函数 通过 各 种 不 同 的 形式 把 编码 的 时 间 转 换 为 文 
本 串 。 最 后 ， 所 有 的 函数 都 要 依赖 内 部 函数 _Strftime 来 完成 实际 的 转换 ， 
不 同 的 只 是 对 区 域 设置 的 选择 。 函 数 asctime (和 扩展 的 函数 ctime) 用 一 
种 固定 的 格式 转换 时 间 ， 不 管区 域 设 置 类 别 LC. TIME 的 当前 状态 是 什么 ， 这 
种 格式 总 是 遵循 "c" 区 域 设 置 的 习惯 。 另 一 方面 ， 函 数 strftime 允许 指定 一 
种 指导 细 分 时 间 转 换 的 格式 。 它 遵循 当前 区 域 设 置 的 习惯 。 因 此 ，_Strftime 
的 一 个 参数 指定 了 要 使 用 的 特定 于 区 域 设 置 的 时 间 信 息 〈_Tinfo 类 型 )。 

图 15-16 显示 了 文件 asctime.c。 它 定义 了 函数 asctime， 这 个 函数 以 
相同 的 方式 对 一 个 细 分 时 间 进 行 格式 化 ， 而 不 管 当前 的 区 域 设 置 是 什么 。 这 
个 文件 也 定义 了 数据 对 象 _Times， 它 指定 了 特定 于 区 域 设 置 的 时 间 信 息 。 文 
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函数 ctime 


å strftime 


函数 
 Strftime 


函数 Gentime 


件 也 定义 了 内 部 数据 对 象 ctinfo， 这 个 对 象 复制 "c" DAGE IMSE. 

图 15-14 显示 了 文件 ctime.c, Å ctime 简单 地 调用 localtime, SK 
后 调用 asctime， 来 转换 它 的 time t 类 型 的 参数 。 因 此 ， 它 总 是 遵循 c" 区 
域 设 置 的 习惯 。 

图 15-15 显示 了 文件 strftime.c. MÅ strftime 使 用 存储 在 Times 
中 的 特定 于 区 域 设 置 的 时 间 信息 来 调用 _Strftime。 因 此 它 的 行为 随 |x ot 

图 15-17 显示 了 文件 xstrftim.c, BE MT KEN Strftime, GAR 
数 完成 格式 化 时 间 信 息 的 所 有 工作 。_Strftime 使 用 文件 xstrftim.c 顶部 
定义 的 宏 PUT 来 传递 字符 。 这 个 宏 封 装 了 所 需要 的 逻辑 来 复制 字符 ， 并 对 它 
们 进行 计数 ， 且 限制 传递 的 数目 。 

<stdlib.h> d Bi AY DI A GN o XE _Mptowc， 使 用 每 次 凋 用 时 提供 的 
_Mbstate 类 型 的 状态 存储 对 多 和 守节 字符 叫 格 式 进 行 解析 。 这 个 问题 和 12.4 
区 描述 的 _Printf 的 相同 。 

图 15-18 显示 了 文件 xgentime.c, CN T A% Gentime, ix^ 
为 Strftime FEM S HK. ph Bl Gentime 主要 由 AAR Em switch i 
FIK. TRUE PORCH MR GET NER. 

每 个 转换 确定 Met» S TRI KDA RIPE KAFE 
换 的 结果 。 它 也 存储 了 -个 对 "en 进行 计数 的 有 符号 整数 。 个 正 的 计数 值 
指示 _Strftime 生成 指定 的 字符 序列 。 

产生 字符 的 一 个 来 源 是 函数 _Gettime， 这 个 消 数 从 特定 于 区 域 设 兽 
的 时 间 信 息 的 -一 个 串 中 选择 一 个 域 。 男 一 个 来 源 是 内 部 冰 数 getval (也 在 
文件 xgentime.c 中 定义 ) 它 产生 十 进 制 整数 。getval 将 那些 字符 存储 在 
_Strftime 提供 的 累加 器 中 。 

注意 Gentime 包含 了 -个 不 规范 的 加 法 。 转 换 说 明 符 8D 在 转换 月 份 中 
的 天 数 时 ， 使 用 第 一 位 空格 米 代替 第 一 位 的 0， 这 也 是 asctime 强调 的 。 

_Gentime 返回 一 个 负 的 计数 值 来 指示 Strftime 把 个 特定 于 区 域 设 
置 转换 的 格式 串 “ 压 入 ” 栈 中 。 有 3 个 转换 随 区 域 设 置 而 改变 一 一 $c、%x 和 
SX. CPM, PERITA x 在 "c" 区 域 设 置 中 就 变 成 了 "Pb Sd sv" 可 以 把 这 些 
转换 表示 为 调用 其 他 转换 的 格式 串 。(6.4 节 描 述 了 如 何 编写 :个 可 以 更 改 这 些 
格式 品 的 区 域 设 置 文件 。) 注意 函数 Strftime 只 支持 RWE. 

文件 xgentime.c 中 的 另 一 个 内 部 郧 数 是 wkgyr。 它 计算 到 一 年 中 一 个 给 
定 的 日 期 的 星期 数 ( 从 那 一 年 开始 )。 - 周 可 以 从 星期 日 (wstart 是 0) 或 
者 星期 一 (wstart 是 1) 开始 。 这 种 特殊 的 逻辑 避免 了 取 余 〈 横 ) 或 者 除 运 
算 符 的 参数 为 负 值 。 
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图 15-17 /* Strftime function */ 
xstrftim.c include <stdlib.h> 
#include <string.h> 
#include "xtime.h" 


/* macros */ 
#define PUT(s, na) (void) Input = (na), \ 
0 < nput && (nchar += nput} <= bufsize ? \ 
{memcpy (buf, s, nput), buf += nput) : 0) 


size_t _Strftime(char *buf, size_t bufsize, const char *fmt, 
const struct tm *t, _Tinfo *tin) 
{ /* format time information 
const char *fmtsav, *s; 
size_t len, lensav, nput; 
size_t nchar = 0; 


for (s = fmt, len = strlen(fmt), fmtsav = NULL; ; fmt = s) 
{ /* parse format string 
int n; 
wchar t wc; 
.Mbsave state - (0); 


while (0 < (n = Mbtowc(&kwc, s, len, &state))) 
{ /* scan for '$' or 'N0' 
s += n, len -= n; 
if (wc == '%") 
break; 
) 
if (fmt « s) /* copy any literal text 
PUT(fmt, s - fnt - (0« n? 1 : 0)); 
if (0 < n) 
{ /* do the conversion 
char ac[20]; 
int m; 
const char *p = _Gentime(t, tin, s++, &m, ac); 


--len; 
if (0 <= m) 
PUT(p, m); 
else if (fmtsav == NULL) 
fmtsav = S, S = p, lensav = len, len -m; 
) 
if (0 == len && fmtsav == NULL || n < 0) 
{ /* format end or bad multibyte char */ 
PUT ("", 1); /* null termination */ 
return (nchar <= bufsize ? nchar - 1: 0); 
} 
else if (0 == len) 
fmtsav, fmtsav = NULL, len = lensav; 
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图 15-18 /* Gentime function */ 
xgentime.c #include "xtime.h" 


/* macros */ 
#define SUNDAY 0 /* codes for tm_wday */ 
#define MONDAY 1 


static char *getval(char *s, int val, int n) 


{ /* convert a decimal value */ 
if (val < 0) 

val = 0; 
for (s += n, *s = 'N0'; 0 <= --n; val /= 10) 


*--s = val $ 10 + '0'; 
return (s); 


) 


static int wkyr(int wstart, int wday, int yday) 
{ /* find week of year */ 
wday = (wday + 7 - wstart) % 7; 
return (yday - wday + 12) / 7 - 1; 
} 


const char *_Gentime(const struct tm *t, _Tinfo *tin, 
const char *s, int *pn, char *ac) 
{ /* format a time field */ 
const char *p; 


switch (*s++) 


{ /* switch on conversion specifier */ 
case 'a': /* put short weekday name */ 
p = Gettime(tin-» Days, t» tm wday << 1, pn); 
break; 
case 'À': /* put full weekday name */ 
p = Gettime(tin-» Days, (t» tm wday << 1) + 1, pn); 
break; 
case 'b': /* put short month name */ 
p = Gettime(tin-» Months, t->tm mon << 1, pn); 
break; 
case 'B': /* put full month name */ 
p= Gettime(tin-» Months, (t-»tm mon << 1) + 1, pn); 
break; 
case 'c': /* put date and time */ 
p = Gettime(tin-> Formats, 0, pn), *pn = -*pn; 
break; . 
case 'd': /* put day of month, from OL */ 
p = getval (ac, t-»tm mday, *pn = 2); 
break; 
case 'D': /* put day of month, from 1 */ 
p = getval(ac, t-»tm mday, *pn = 2); 
if (ac[0] == '0') 
ac[0] = ' '; 
break; 
case 'H': /* put hour of 24-hour day */ 


p = getval(ac, t->tm hour, *pn - 2); 
break; 


Æ 15-18 
GE) 
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case 'I' /* put hour of 12-hour day */ 
p - getval(ac, t-»tm hour % 12, *pn = 2); 
break; 
case 'j': /* put day of year, from 001 */ 
p = getval(ac, t-»tm yday + 1, *pn = 3); 
break; 
Case 'm': /* put month of year, from 01 */ 
p = getval(ac, t-»tm mon + 1, *pn = 2); 
break; 
case 'M': /* put minutes after the hour */ 
p = getval(ac, t->tm min, *pn = 2); 
break; 
case 'p': /* put AM/PM */ 
p =  Gettime(tin-> Ampm, 12 <= t->tm hour, pn); 
break; 
case 'S': /* put seconds after the minute */ 
p = getval(ac, t->tm sec, *pn - 2): 
break; 
case 'U': /* put Sunday week of the year */ 
p = getval (ac, 
wkyr (SUNDAY, t->tm wday, t-»tm yday),*pn = 2); 
break; 
case 'w': /* put day of week, from Sunday */ 
p = getval(ac, t->tm wday, *pn = 1); 
break; 
case 'W': /* put Monday week of the year * / 
p = getval (ac, 
wkyr(MONDAY, t->tm wday, t-»tm yday),*pn = 2); 
break; 
case 'x': /* put date */ 
p = Gettime(tin-» Formats, 1, pn), *pn = -*pn; 
break; 
case 'X': /* put time */ 
p =  Gettime(tin-> Formats, 2, pn), *pn = -*pn; 
break; 
case 'y': /* put year of the century */ 
p = getval(ac, t->tm year % 100, *pn = 2); 
break; 
case 'Y': /* put year */ 
p = getval(ac, t-»tm year + 1900, *pn = 4); 
break; 
case 'Z': /* put time zone name */ 
if (tin-» Tzone[0] == '\0') 
tin-» Tzone = _Getzone(); /* adapt zone */ 
p = Gettime(tin-» Tzone, 0 < t-»tm isdst, pn); 
break; 
case '$': /* put "ën */ 
p= "ën, *pn = 1; 
break; 
default: /* unknown field, print it */ 
p=s -1, *pn = 2; 
} 
return (p); ED 
} 口 
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15.5 «time.h» 的 测试 


图 15-19 显示 了 文件 ttime.c。 测 试 程序 对 <time.h> 中 声明 的 所 有 函数 
执行 基本 的 测试 。 作 为 质量 检查 ， 它 也 显示 了 运行 程序 时 函数 time 的 日 期 
和 时 间 的 返回 值 。 如 果 一 切 顺 利 ， 这 个 程序 将 有 类 似 以 下 的 输出 : 


Current date -- Sun Dec 2 06:55:15 1979 
SUCCESS testing <time.h> 


图 15-19 R test time functions */ 

ttime.c #include «assert.h» 
#include <stdio.h> 
#include <string.h> 
#include <time.h> 


int main() 
{ /* test basic workings of time functions */ 
char buf [32]; 
clock t te = clock(); 
struct tm tsl; 
time t ttl, tt2; 
Static char *dstr - "Sun Dec 2 06:55:15 1979\n"; 


ttl = time(&tt2); 
assert (ttl == tt2); 
tsl.tm_sec = 15; 
tsl.tm min 55; 
tsl.tm hour - 6; 
tsl.tm mday - 2; 
tsl.tm mon - 11; 
tsl.tm year - 79; 


u 


tsl.tm isdst - -1; 
ttl = mktime(&ts1); 
assert(tsl.tm wday == 0): 


assert(tsl.tm yday -- 335); 
++tsl.tm sec; 

tt2 = mktime(&tsl); 
assert(difftime(ttl, tt2) < 0.0); 


assert(strcmp(asctime(localtime(&tt1)), dstr) == 0); 

assert (strftime(buf, sizeof (buf), "$&s", 
gmtime(&tt2)) -- 2); 

assert (strcmp (buf, "16") == 0); 

assert(tc «- clock()); 

fputs("Current date -- ", stdout); 

time (&tt1); 


fputs(ctime(&ttl), stdout); - 
puts("SUCCESS testing «time.h»"); 
return (0); 


) Li 
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1975). DREA USATE DUIS ZR vu. BA BAA Ta SE AN RI E, "CE 
告诉 你 的 可 能 比 你 想 知道 的 还 多 。 它 也 解释 了 天 和 口 期 为 什么 以 今天 这 种 方 
式 命 名 和 确定 。 


写 个 区 域 设 置 文件 ， 这 个 文件 按照 法 语 的 习惯 表示 时 间 ， 你 需要 改变 以 下 
儿 项 。 
am pm days 


dst rules months 
time zone time formats 


测试 新 的 区 域 设 置 。( 提 人 下: 可 以 从 本 章 利 前 儿 章 的 测试 程序 入 于 。) 


便 定 你 生活 的 地 方 的 复 令 时 的 井 始 和 结 东 的 规则 。( 如 果 你 生活 的 地 方 不 使 
WSO, ot - ASKE DOR BETRE SB ART) 写 :个 遵守 这 个 
规则 的 区 域 设 置 文件 。 在 过 去 的 20 年 中 ， 这 个 规则 是 怎样 改变 的 ? 你 能 为 
dst rules 用 -个 区 域 设 置 文件 说 明 来 简明 地 表示 所 有 这 些 变化 吗 ? 


ue cg 4 的 倍数 的 年 份 发 生 ， 一 般 不 在 100 的 倍数 的 年 份 发 生 ， 但 是 会 
在 400 的 倍数 的 年 份 发 牛 。 修 改 文 件 xttotm.c 中 定义 的 函数 _Daysto， 确 
定 1801 年 之 前 和 2099 御 之 后 的 时 离 最 近 的 头 年 。 在 哪 : 段 时 间 能 够 让 这 个 
PA OE di e? 


Ju pk long delta-days(int year,int mon,int delta-man), 1% rÁ 
数 计算 “ 定 范 围 的 月 份 中 的 天 数 。 初 始 的 大 是 年 份 year 中 的 月 份 mon 的 第 
大， 月 份 的 范围 是 有 符号 值 aelta_man。 你 为 什么 需要 指定 初始 的 年 份 ? 
为 你 的 系统 实现 基本 限 数 clock 和 上 time。 对 于 这 些 郧 数 的 返回 值 的 精度 OA 

意义 ) 你 有 什么 看 法 ? 
WER, ACER USIP AERO E” WME T REE 


Ci i T HR food ED REIT DEEP XUI In, ZE time 函数 的 适 
"Ub rhe. 
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15.8 


15.9 


[3€ ] 把 世界 上 所 有 的 时 区 汇集 到 一 个 表 中 。 为 这 些 时 区 设计 一 种 便于 记忆 的 
命名 方案 。 添 加 一 个 函数 ， 这 个 函数 可 以 通过 这 个 助 记 名 字 确 定 你 的 工作 时 
区 。 怎 么 处 理 夏令 时 ? 


[ 很 难 ] 设计 - -种 使 用 文本 串 简洁 地 表示 日 历时 间 的 符号 ， 人 们 可 以 很 容易 地 
打出 这 些 字符 品 。 编 写 了 水 数 time_t strtotime(const char *)， 这 个 函数 可 
以 分 析 一 个 以 空 字 符 结尾 的 日 历时 间 串 ， 并 且 生 成 相对 应 的 编码 日 历时 间 。 
你 怎样 调整 这 个 符号 使 它 能 适合 当前 的 区 域 设置 ? 


假设 


<ctype.h> 


<errno.h> 


«float.h» 


H 


这 个 附录 概括 了 把 C 标 准 库 实现 和 一 个 具体 的 执行 环境 连接 到 一 起 所 要 
做 的 工作 。 它 主要 面向 那些 想 使 用 目前 为 止 我 给 出 的 实现 做 点 什么 的 读者 ， 
其 他 人 只 有 在 理解 涉及 的 话题 后 ， 才 会 发 现 一 些 有 趣 的 东西 。 如 果 你 只 关心 
C 标 准 或 者 给 用 户 的 建议 ， 那 么 可 以 跳 过 下 面 的 内 容 。 


即使 对 于 可 能 的 实现 人 员 ， 对 本 附录 的 使 用 差别 也 会 很 大 。 有 些 只 是 希 
望 控 气 一些 有 用 的 代码 ， 那 么 这 些 人 只 需要 找到 满足 其 要 求 的 相关 小 节 :， 而 
其 他 人 可 能 想 用 它们 完全 取代 一 个 现 有 的 C 库 ， 那 么 他 们 要 做 更 多 的 工作 。 
这 里 我 只 是 粗略 地 指出 了 那些 额外 的 步骤 。 


我 引用 了 头 文件 <yvals.h> 来 概括 尺 可 能 多 的 参数 。 在 那些 不 能 使 用 这 
个 头 文件 的 地 方 ， 我 引用 头 文件 "yfuns .h" 来 修改 那些 低级 原 诸 的 名 字 。 我 
没有 保证 只 改变 这 些 头 文件 就 可 以 使 这 个 库 适 应 所 有 可 能 的 环境 。 代 码 受 到 
各 种 假设 的 限制 。 在 这 些 假设 不 能 满足 的 地 方 ， 你 必须 修改 代码 来 适应 这 些 
情况 。 下 面 是 必须 满足 的 假设 : 


口 


口 


所 有 文件 回顾 0.4 节 开 始 的 假设 ， 库 的 很 多 部 分 都 假设 用 户 能 在 
库 内 部 定义 可 写 的 静态 数据 对 象 。 参 考 2.4 节 的 相关 讨论 。 
<ctype.h>—— X få xctype.c, xtolower.c 和 xtoupper.c 假 设 执 
行 字符 集 是 ASCIHI。 把 它们 包含 的 表 修改 为 一 个 不 同 的 字符 集 。 这 些 
文件 也 假设 一 个 char 占据 8 位 。 如 果 char IL 8 位 大 ， 那 就 可 能 要 重 
新 考虑 以 这 个 表 为 基础 的 方法 。 

«errno.h»— — X f. errno.c 和 errno.h 假设 可 以 把 errno 作为 一 
个 可 写 的 静态 数据 对 象 来 维护 。 为 了 获得 延缓 的 错误 报告 ， 可 能 需要 
在 每 次 访问 errno 的 时 候 都 调用 一 个 函数 。 

<float.h> 一 一 文件 float.h 和 xfloat.c 假 设 浮 点 值 的 格式 是 
IEEE 754 或 者 一 个 和 它 接近 的 相关 形式 。 如 果 格 式 有 很 大 不 同 ， 那 
AN] RES ør GEL «yvals.h» 中 的 参数 为 基础 的 实现 方法 。 
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a 


<limits.h> 


<locale.h> 


<math.h> 


<stdarg.h> 


«stddef.h» 


原 语 


<setjmp.h> 


<signal.h> 


«stdio.h» 


«stdlib.h» 


D 


«limits.h»— CHE limits.h fitit — Å char "E St did gie, -- Å 
int 变量 占据 2 个 或 4 个 字 节 。( 参 考 54 节 的 相关 讨论 。) 

这 些 代码 假设 了 库 的 某 几 个 部 分 内 部 工作 的 知识 。 
如 果 你 修改 了 <ctype.h> (转换 表 )、<limits.h> (MB LEN MAX), 
<stdlib.h> (EE Wë), <string.h> (整理 函数 ) 或 者 «time.h» 
(特定 于 区 域 设 置 的 时 间 信 息 ) 中 的 任何 代码 ， 就 可 以 到 这 申 HE] 


iU. 


<locale.h> 


«math.h»— — jx He (C BOM T$ da Fe aX AY MERE IE 4S b RI AT mt (5 
<float.h> Hild. (SEU 7.1 节 开始 的 讨论 。) 如 果 double 保留 了 
多 于 56 位 的 精度 或 者 以 10 为 基数 ， 那 么 就 要 准备 做 些 大 的 修改 。 
«stdarg.h»— — X f: stdarg.h 假设 传递 给 范 数 的 参数 存储 在 向 上 上 分 
配 的 存储 空间 中 ， 它 们 遵循 一 种 可 预见 的 模式 。( 参 痊 10.4 15.) 如 
果 这 些 假设 中 有 任何 一 个 不 成 立 ， 你 必须 重新 芍 处 这 种 方法 。 
«stddef.h» 文件 stdde£f.h 中 的 宏 offsetof 假设 读者 可 以 实现 
某 些 涉及 指针 和 整数 的 技巧 。( 参考 NAT.) axe ANN, fog 
必须 重新 找到 一 个 替代 的 可 以 工作 的 技巧 集 。( 这 样 的 集合 一 定 存 在 .) 


有 19 个 毅 数 在 很 大 程度 上 依赖 于 执行 环境 ， 可 以 把 它们 作为 连接 实现 和 
执行 环境 的 基本 原 庄 对 待 。 我 基本 上 不 去 尝试 提供 这 些 隐 数 的 参数 化 版 本 ， 
因为 在 这 里 需要 对 它们 进行 重大 修改 。 在 很 多 情况 下 ， 一 个 CK BUP INT 
孙 数 可 以 代替 它们 。 除 非 你 想 完 全 取代 一 个 现 有 的 C 库 ， 耕 则 你 就 本 以 使 用 
这 些 代码 ， 而 不 用 自己 重新 编写 。 下 面 是 对 这 些 原 诸 的 一 些 总 结 : 


O «setjmp.h»——— Xf Aj — TS AK Di ek Be setjmp 和 longjmp 必 


须 用 汇编 语言 编写 。 或 者 可 以 通过 修改 文件 yvals.n 中 定义 的 宏 
_NSETUMP 来 调整 文件 setjmp.h。 然 而 ， 不 要 餐 望 使 用 示例 文件 
longjmp.c 和 setjmp.c. 

<signal.h> 一 一 一 定 要 修改 文件 raise.c 和 signal.c 来 控制 使 件 信 
号 。 基 些 系统 对 珊 数 signal MRS PIUS KRL 
«stdio.h»— — fy 9 eK CRUZ fl Sie mr RECS EH flos 2r 
Mr. DOE PR X TE X ff remove.c, rename.c, tmpnam.c, xfgpos. 
c, xfopen.c 和 xfspos.c 路 ， 这 些 宏 是 文件 yfuns.ha 中 定义 的 
_Fclose、_Fread 和 _EFwrite。 某 些 系 统 为 某 些 遇 数 直接 提 供 了 代 


ARPA. SAT. RESET PARA. ROM ATE TMT, Vy 
能 也 要 对 得 上 。 


<stdlib.h> 


A 4 Ar RACHA FE AK SG RUE m) LG fel å oP 
Mr. Et på Hr X fk getenv.e, system.c Ål xgetmem.c i|, 
宏 是 文件 yfuns.h 中 定义 的 _Exit。 在 文件 yfun.h 中 正确 地 定义 
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<time.h> 


头 文件 
"yfuns.h" 


图 A-1 


yfuns.h 


或 者 声明 了 数据 对 象 Soup 以 后 ， 你 可 以 经 常 使 用 这 里 给 出 的 文件 


getenv.c, 


O <time.h> 一 一 有 两 个 函数 使 系统 的 大 部 分 和 代码 的 其 他 部 分 独立 。 
IX HE RIK TE SCE clock.c 和 time.c 中 。 就 像 我 在 这 里 做 的 这 样 ， 可 
以 在 time.c 的 基础 上 编写 clock.c， 如 果 执 行 环境 对 消耗 的 处 理 器 
时 间 没 有 提供 一 个 独立 的 测量 ， 这 样 做 就 会 很 方便 。 


图 A-1 显 示 了 文件 yfuns .h， 它 是 头 文件 "yfuns .h" 的 一 个 版 本 ， 可 以 在 
很 多 UNIX 系 统 下 工作 。 该 文件 遵循 了 我 对 以 前 的 UNIX 例 子 使 用 的 命名 规 
则 。 下 面 是 一 个 完整 的 具有 外 部 连接 的 名 字 的 列表 ， 在 UNIX 下 这 个 实现 需 
要 定义 这 些 名 字 。 每 一 个 名 字 后 面 是 常规 的 UNIX 库 名 字 : 

. Environ environ  Lseek lseek 

Clock clock | Open open 

Close close Read read 
.Execl execl Sbrk sbrk 
Exit exit Signal signal 
Fork fork Time time 
.Getpid getpid ,Unlink unlink 
Kill kill Write write 
Link link 


我 把 Environ 放 在 第 一 位 是 因为 它 命名 了 一 个 数据 对 象 。( 像 定义 在 <ermo. 
h> 中 的 宏 errno 一 样 ， 必 要 的 时 候 ， 它 可 以 是 一 个 返回 指针 的 函数 调用 。) 
其 他 所 有 名 字 的 函数 都 提供 UNIX 系统 服务 。 你 也 可 以 编写 或 者 修改 汇编 语 
言 文件 来 提供 这 些 服 务 。 


/* yfuns.hfunctions header -- UNIX version */ 
#ifndef _YFUNS 
fidefine YFUNS 
/* macros */ 
fdefine Envp (* Environ) 
*define Fclose(str)  Close((str)-» Handle) 
ddefine Fread(str, buf, cnt) Read((str)-> Handle, buf, cnt) 


#define | Fwrite(str,buf. cnt)  Write((str)-» Handle, buf, cnt) 
/* interface declarations */ 

extern const char **-Environ; 

int Close(int); 

void Exit ( int ); 

int Read(int, unsigned char *, int); 

int Write(int, const unsigned char *, int); 

fendif 


可 以 用 常规 的 名 字 来 取代 这 些 保留 名 字 。 那 是 开始 使 用 这 个 实现 的 快速 
的 方式 ， 但 是 那 种 捷径 也 会 导致 一 些 命名 冲突 ， 并 且 它 也 违背 了 C 标 准 中 关 
于 命名 空间 使 用 的 规则 。 
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u 


_CPS 
_CSIGN 


在 给 定 了 必要 的 原 语 的 情况 下 ， 通 过 修改 内 部 头 文件 <yvals .h> 来 适应 


口 


口 


口 


口 
口 


剩余 的 代码 。 这 个 头 文件 定义 了 下 面 的 宏 : 


—ADNBND— —stdarg.h 使 用 这 个 宏 来 使 参数 指针 后 移 〈 值 一 般 为 o. 
1、3 或 7)。 
_AUPBND——stdarg.h 使 用 这 个 宏 来 使 参数 指针 前 移 〈 值 一 般 为 0、 
1、3 或 7)。 

_C2 limits.h 使 用 这 个 宏 来 把 2 的 补 码 表 示 〈 值 1) 和 1 的 补 码 
表示 或 有 符号 数值 E 0) 区 分 开 。 

_CPS time.h 使 用 这 个 宏 来 确定 宏 CLOCKS PER SEC 的 值 。 
.CSIGN—-limits.h 使 用 它 来 确定 char E nf NÆR AE (EIET) 
还 是 只 能 表示 正 值 ( 零 )。 

_D0 一 一 多 个 文件 使 用 它 来 确定 浮 点 值 存 储 的 字 节 顺序 〈 值 为 0 或 3)。 
_DBIAS 一 一 某 几 个 文件 使 用 它 来 确定 double 的 特征 值 和 它 的 有 符号 
指数 的 差 值 。 

_DLONG 一 一 某 几 个 文件 使 用 它 来 确定 long double 是 IEEE 754 10 字 节 
Rest GEER) 还 是 和 double 相同 (E). 

_DOFF 一 一 某 几 个 文件 使 用 它 来 确定 一 个 double 特征 值 在 最 高 有 效 字 
中 的 偏 移 位 。 

 EDOM—errno.h 使 用 它 来 确定 宏 EDOM 的 值 。 


_EFPOS——errno.h 使 用 它 来 确定 宏 EFPOS 的 值 。 
_ERANGE errno .h 使 用 它 来 确定 宏 ERANGE 的 值 。 
 .ERRMAX— —errno.h 使 用 它 来 确定 错误 编码 的 范围 。 


_FBIAS 一 一 xf10at.h 使 用 它 来 确定 一 个 float 特征 值 和 它 的 有 符号 
指数 之 间 的 差 值 。 

_FNAMAX. stdio.h 使 用 它 来 确定 宏 FILE NAME MAX 的 值 。 
_FOFF 一 一 xf1oat.h 使 用 它 来 确定 一 个 float 特征 值 在 最 高 有 效 字 中 
的 偏 移 位 。 

_FOPMAX——-stdio.h 使 用 它 来 确定 宏 FOPEN MAX 的 值 。 
_FRND 一 一 f1oat.h 使 用 它 来 确定 宏 FLT ROUNDS 的 值 。 
 ILONG——limits.h 使 用 它 来 确定 int 占据 32 få CASES) 还 是 16 
fi (EF). 

_LBIAS 一 一 某 儿 个 文件 使 用 它 来 确定 一 个 long double 特征 值 和 它 的 
有 符号 指数 之 间 的 差 值 。 

_LOFF 某 几 个 文件 使 用 它 来 确定 一 个 long double 特征 值 在 最 高 
有 效 字 中 的 偏 移 位 。 

_MBMAX——limits h 使 用 它 来 确定 宏 MB LEN MAX 的 值 。 

_MEMBND 一 一 某 几 个 文件 使 用 它 来 指定 最 坏 情 况 的 存储 空间 边界 ( 值 
一 般 为 0、1、3 或 7)。 
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DEC VAX 
VLTRIX 


Sun UNIX 下 
的 GNU C 


完整 的 库 


O _NSETJMP 一 一 setjmp.h 使 用 它 来 确定 int jmp_buf 数组 的 大 小 。 

D _NULI 一 一 某 几 个 文件 使 用 它 来 确定 宏 NULL 的 值 ( 值 为 0、0L 或 
(void *) 05, 

O . SIGABRT ——signal.h 使 用 它 来 确定 宏 SIGABRT 的 值 。 


O _SIGMAX signal.h 使 用 它 来 确定 信号 编码 的 范围 。 

C) _TBIRAS 一 一 某 几 个 文件 使 用 它 来 纠正 表示 为 time c 类 型 的 日 历时 间 
的 起 始点 。 

O _TNAMAx——stdio.h 使 用 它 来 确定 宏 工 tmpnam 的 值 。 


我 会 给 出 几 个 例子 ， 它 们 也 具有 这 些 参 数 。 


图 A-2 显 示 了 文件 yvals .h， 这 是 头 文 件 <yvals.h> 在 VAX ULTRIX 系 
统 下 工作 的 版 本 。 大 部 分 参数 都 适用 于 很 多 UNIX 的 版 本 。 浮 点 参数 描述 了 
VAX 和 较 老 的 PDP-11 计 算 机 体系 结构 支持 的 特有 格式 。 那 种 格式 并 不 真正 支 
持 Inf 和 NaN 的 编码 ， 但 是 无 论 怎样 ， 这 个 库 定义 了 它们 。 只 要 你 不 对 这 些 
特殊 编码 执行 算术 操作 ， 它 们 还 会 传达 有 用 的 信息 。 

可 以 容易 地 把 yvals .h 的 这 个 版 本 修改 为 可 以 在 Sun UNIX Cf Hl 


Motorola MC680X0 微 处 理 器 ) 下 的 GUN C 编 译 器 中 工作 。 首 先 ， 修 改 找 述 
IEEE 754 格 式 的 浮 点 型 参数 : 


#define DO 0 
#define _DBIAS Ox3fe 
#define _DLONG 0 
#define _DOFF 4 
#define _FBIAS Ox7e 
#define _FOFF 7 
#define _FRND 1 
#define _LBIAS Ox3fe 
#define _LOFF 4 
然后 修改 存储 对 齐 参数 : 
#def ine _AUPBND 3U 
#def ine _ADNBND 0U 
#def ine _MEMBND 3U 


当然 ， 也 必须 提供 一 个 重新 命名 的 UNIX 系 统 服务 的 集合 。 


如 果 你 的 目标 是 对 一 个 具体 的 编译 器 ， 完 全 取代 一 个 现 有 的 库 ， 你 还 要 
关注 以 下 两 点 。 
O 必须 提供 一 个 C 启动 头 文件 (startup header)， 这 个 头 文件 开始 的 时 
候 从 操作 系统 获得 控制 权 。 这 就 要 求 熟知 操作 系统 如 何 运行 程序 的 知 
识 。C 启动 头 文件 保证 了 可 以 正确 地 设置 调用 栈 ， 正 确 地 初始 化 静态 
存储 空间 ， 且 3 个 标准 流 已 经 打开 。 它 调用 main 函数 ， 然 后 用 main 
返回 的 状态 调用 exit。 不 同 的 操作 系统 在 这 些 方 面 提供 的 帮助 参差 
不 齐 。 


/*yvals.h values header -- VAX ULTRIX version */ 
tdefine YVALS 

/* errno properties */ 
#define EDOM 33 
#define_ERANGE 34 
#define_EFPOS 35 
#define_ERRMAX 36 ` 

/* float properties */ 
#define_DO 0 
fidefine DBIAS 0x80 
#define_DLONG 0 
#define-DOFF 7 
#define_FBIAS 0x80 
#define_FOFF 7 
#define_FRND 1 
#define-LBIAS 0x80 
#define_LOFF 7 

/* integer properties */ 
fdefine C2 1 
#define_CSIGN 1 
fidefine ILONG 1 
#define_MBMAX 8 
typedef unsigned short -Wchart; 

/* pointer properties */ 
Hdefine NULL (void *) 0 
typedef int -Ptrdifft; 
typedef unsigned int -Sizet; 

/* setjmp properties */ 
#tdefine_NSETJMP 80 

/* signal properties */ 
#define_SIGABRT 6 
#define_SIGMAX 32 

/* stdio properties */ 
fdefine FNAMAX 64 
#define_FOPMAX 16 
#define_TNAMAX 16 

/* stdlib properties */ 
#define_EXFAIL 1 

/* storage alignment properties */ 
#define_AUPBND 3U 
#define_ADNBND 3U 
#def ine_MEMBND7U 

/* time properties */ 
#define_CPS 1 
#define TBIAS 0 o 


O 必须 提供 所 有 的 C 运 行 时 (runtime) 函数 ， 生 成 的 代码 可 能 调用 
这 些 函 数 。 这 就 要 求 熟 知 编译 器 如 何 生成 代码 的 知识 。 例 如 ， 一 个 
switch 语句 ， 经 常 使 用 内 联 代码 调用 一 个 运行 时 清 数 ， 而 不 是 执行 所 
有 的 比较 和 人 分支。 不同 的 编译 器 对 C 运行 时 函数 的 依赖 程度 差别 很 
Ko 
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Borland Turbo 
C++ 


IN 


f IE LASER YE RISE, ilU ABUSE AUS ULTRIX 或 者 GNU 


库 没 有 任何 优势 可 言 。 


我 也 使 用 Borland Turbo C++ 编译 器 运行 了 这 本 书 中 的 代码 。 (我 还 使 用 


过 其 中 附带 的 ANSI C 编 译 器 。) 你 可 以 自由 选择 要 取代 Borland HÆ VU. * 
你 甚至 可 以 在 一 定 程 度 上 获得 Borland 库 源 代 码 。 下 面 是 yvals .h 使 用 这 个 编 
PERS IRA: 


/* yvals.h values header -- Turbo C++ version */ 
#define _YVALS 

/* errno properties */ 
#define . EDOM 33 
d$define _ERANGE 34 
#define _EFPOS 35 
#define _ERRMAX 36 

/* float properties */ 
#define DO 3 
#def ine _DBIAS Ox3fe 
#define _DLONG 1 
#define .DOFF 4 
#fdefine _FBIAS Ox7e 
#define .FOFF 7 
tdef ine _FRND 1 
define  LBIAS Ox3ffe 
#define _LOFF 15 

/* integer properties */ 
#define _C2 1 
#define _CSIGN 1 
#define _ILONG 0 
#tdefine _MBMAX 8 


typedef unsigned short -Wchart; 
/* pointer properties */ 
#def :ne NULL (void *) 0 
typedef int Ptrdifft; 
typedef unsigned int , Sizet; 
/* setjmp properties */ 


define .NSETJMP 10 
/* signal properties */ 
#define _SIGABRT 22 
#define _SIGMAX 32 
/* stdio properties */ 
#define  FNAMAX 64 
#define _FOPMAX 16 
#define _TNAMAX 16 
/* stdlib properties */ 
#define _EXFAIL 1 
/* storage alignment properties */ 
#define _AUPBND 1U 
#define _ADNBND 1U 
#def ine  MEMBND 1U 
/* time properties */ 
#define _CPS 1 
#define _TBIAS ((70 * 365LU + 17) * 86400) 
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其 他 系统 


IBM 
Systme/370 


独立 式 程序 


改进 


Borland 提 供 的 C 局 动 头 文件 定义 了 abort Ål errno。 如 果 要 取代 它们 ， 
就 必须 获得 它们 的 源 代码 并 量 修 改 它 。 否 则 ， 最 大 的 担心 就 是 MS-DOS 表 示 
文本 文件 的 方式 。 在 Fredy EF CE) 回 车 ， 而 在 _Fwrite 中 必须 
在 〈 某 些 ) 换行 前 加 入 回 车 。 同 时 也 要 更 正在 _Fgpos 和 _Fspos 中 作 的 某 些 改 
zh. xp Pags ZC Borland 库 中 你 通常 会 发 现 很 多 版 本 。 


其 他 操作 系统 与 UNIX 没 有 太 大 关系 。 这 就 使 它们 更 难 满足 C 标 准 要 求 的 
方式 。 通常 ， 最 大 的 问题 是 输入 /输出 模式 。 如 果 要 让 流 的 行为 很 健壮 ， 那 么 
结构 化 为 记录 和 块 的 文件 就 必须 进行 精细 的 处 理 。 在 一 个 具有 记录 或 块 结构 
的 文件 中 很 难 正 确 处 理 文 件 定 位 要 求 。 


IBM Systme/370 是 一 个 极端 的 例子 。 其 上 的 操作 系统 所 遵循 的 约定 比 
UNIX 要 早 得 多 。 甚 至 这 些 操作 系统 中 最 简单 的 一 个 系统 都 要 求 使 用 特殊 的 
接口 来 正确 地 支持 标准 C。 它 们 中 最 大 的 系统 可 以 简单 地 调用 特定 于 系统 的 
代码 ， 这 些 代 码 的 大 小 和 复杂 度 方 面 都 和 本 书 中 组 合 的 代码 相当 。 这 种 情况 
下 你 绝对 希望 构建 其 他 操作 系统 下 的 工作 方法 。 


如 果 你 的 日 标 是 使 用 这 个 库 生 成 独立 式 程 序 ， 那 么 你 还 要 关注 其 他 的 东 
西 。 你 没有 操作 系统 可 以 依靠 ,或 者 最 好 是 一 个 不 完整 的 操作 系统 。 同 一 个 
计算 机 体系 结构 下 的 现 有 的 C 交 叉 编译 器 可 能 给 你 提供 C 启 动 代码 和 一 个 修 
改 后 可 适应 独立 环境 的 C 运 行 时 。 一 个 设计 为 只 生成 托管 程序 的 编译 器 就 需 
要 你 做 这 两 个 方面 的 工作 。 

你 必须 提供 的 很 多 原 语 通常 是 一 个 独立 环境 的 存根 。 例 如 ， 考 虑 一 个 只 
支持 通过 一 个 端口 进行 字符 的 顺序 输入 和 输出 的 执行 环境 。 随 数 _Fread 和 
_Ewrite 只 需要 处 理 这 个 端口 ，_Fgpos、._Fopen 等 国 数 对 任何 参数 都 可 以 失 
败 。 如 果 你 的 需求 是 适度 的 ， 你 可 以 去 掉 这 里 的 很 多 难点 。 


你 可 能 也 希望 进行 各 种 改进 。 例 如 ， 可 以 添加 错误 编码 (到 errno.h 和 
strerror.c 中 ) 。 你 可 以 添加 信号 编码 (到 signal.h 和 raise.c 中 ) 。 你 
可 以 实现 各 种 区 域 设 置 ， 甚 至 可 以 把 较 常用 的 区 域 设 置 直接 构建 到 库 中 。 你 
可 以 编写 divý strlen 等 师 数 的 增强 版 。 这 个 清单 是 无 穷 无 尽 的 ， 所 以 这 里 
就 不 多 说 了 。 但 是 你 可 以 继续 探索 。 祝 你 好 运 ! 


这 个 附录 列 出 了 库 的 这 个 实现 定义 的 实体 名 字 ， 这 些 实体 都 有 外 部 连接 


ZF 

BUFSIZ 

CHAR BIT 

CHAR MAX 

CHAR MIN 
CLOCKS PER SEC 
DBL DIG 
DBL_EPSILON 
DBL_MANT_DIG 
DBL_MAX 

DBL MAX 10 EXP 
DBL MAX EXP 
DBL MIN 
DBL, MIN 10, EXP 
DBL MIN EXP 
EDOM 

EFPOS 

EOF 

ERANGE 
EXIT-FAILURE 
EXIT SUCCESS 
FILE 

FILENAME MAX 
FLT DIG 

FLT EPSILON 
FLT MANT DIG 
FLT MAX 

FLT MAX 10 EXP 
FLT MAX EXP 
FLT MIN 

FLT MIN 10 EXP 


头 文件 
<stdio.h> 
<limits.h> 


<limits.h> 
«limits.h» 


«time.h» 


«float. 
«float. 
«float. 
«float. 
«float. 
«float. 
«float. 
«float. 
«float. 


«errno. 
«errno. 
«stdio. 


«errno. 


«stdlib.h» 
«stdlib.h» 


«stdio. 
«stdio. 


«float. 
«float. 
«float. 
«float. 
«float. 
«float. 
«float. 
«float. 


h> 
h> 
h> 
h> 
h> 
h> 
h> 
h> 
h> 
h» 
h» 
h> 
h> 


文件 


stdio.h. 
h 
h 
h 


limits. 
limits. 
limits. 


time.h 
float. 
float. 
float. 
float. 
float. 
float. 
float. 
float. 
float. 
errno. 

errno. 

stdio. 

errno. 


stdlib.h 
stdlib.h 


stdio. 
stdio. 
float. 
float. 
float. 
float. 
float. 
float. 
float. 
float. 


RE e S ege pe Le Ee Sr Së 


rør sør EC EECH 


或 者 在 其 中 一 个 标准 头 文件 中 定义 。 它 们 是 程序 可 以 看 到 的 名 字 ， 不 管 这 对 
你 的 程序 是 好 还 是 坏 。 出 现 了 两 次 的 函数 名 说 明 在 声明 它 的 标准 头 文件 中 有 
一 个 屏蔽 它 的 声明 的 宏 定义 。 


所 在 页 


276 
76 
76 
76 

424 
66 
66 
66 
66 
66 
66 
66 
66 
66 
53 
53 

276 
53 

354 

354 

276 

276 
66 
66 
66 
66 
66 
66 
66 
66 


RRB 名 字 
名 字 AME 文件 所 在 页 
FLT MIN EXP <float.h> float.h 66 
FLT RADIX <float.h> float.h 66 
FLT ROUNDS <float.h> float.h 66 
FOPEN, MAX <stdio.h> stdio.h 276 
HUGE_VAL <math.h> math.h 138 
INT MAX <limits.h> limits.h 76 
INT MIN <limits.h> limits.h 76 
LC ALL <locale.h> locale.h 96 
LC COLLATE *locale.h» locale.h 96 
LC CTYPE <locale.h> locale.h 96 
LC MONETARY <locale.h> locale.h 96 
LC-NUMERIC <locale.h> locale.h 96 
LC-TIME <locale.h> locale.h 96 
LDBL DIG <float.h> float.h 66 
LDBL EPSILON <float.h> float.h 66 
LDBL MANT DIG <float.h> float.h 66 
LDBL MAX «float.h» float.h 66 
LDBL, MAX 10 EXP <float.h> float.h 66 
LDBL MAX EXP <float.h> float.h 66 
LDBL MIN <float.h> float.h 66 
LDBL MIN 10 EXP <float.h> float.h 66 
LDBL MIN EXP <float.h> float.h 66 
LONG MAX <limits.h> limits.h 76 
LONG MIN <limits.h> limits.h 76 
L_tmpnam <stdio.h> stdio.h 276 
M MB CUR MAX <stdlib.h> stdlib.h 354 
MB LEN MAX <limits.h> limits.h 76 
NULL <locale.h> locale.h 96 
un <stddef.h> Stddef.h 223 
"on <stdio.h> _ stdio.h 276 
"on <stdlib.h> stdlib.h 354 
"oc <string.h> string.h 398 
"om <time.h> time.h 424 
RAND MAX <stdlib.h> stdlib.h 354 
SCHAR MAX <limits.h> limits.h 76 
SCHAR MIN <limits.h> limits.h 76 
SEEK-CUR <stdio.h> stdio.h 276 
SEEK END «stdio.h» Stdio.h 276 
SEEK SET <stdio.h> stdio.h 276 
SHRT MAX <limits.h> limits.h 76 
SHRT MIN <limits.h> limits.h 76 
SIGABRT <signal.h> signal.h 200 
SIGFPE <signal.h> signal.h 200 
SIGILL <signal.h> signal.h 200 
SIGINT <signal.h> signal.h 200 
SIGSEGV <signal.h> signal.h 200 
SIGTERM <signal.h> signal.h 200 
SIG DFL <signal.h> signal.h 200 


名 字 
SIG_ERR 
SIG_IGN 
TMP MAX 
UCHAR MAX 
UINT MAX 
ULONG MAX 
USHRT MAX 
abort 


asctime 
asin 
assert 
atan 
atan2 
atexit 
atof 


"on" 


atoi 


atol 
bsearch 
calloc 
ceil 
Clearerr 
clock 
clock t 


cosh 
ctime 
difftime 
div 
div t 
errno 
exit 
exp 
fabs 
fclose 
feof 
ferror 
fflush 
fgetc 
fgetpos 


"on 


头 文 件 
<signal.h> 
<signal.h> 
«stdio.h» 
«limits.h» 
<limits.h> 
<limits.h> 
«limits.b» 
«stdlib.h» 
<stdlib.h> 
<math.h> 
<math.h> 
<time.h> 
<math.h> 
<math.h> 
<assert.h> 
<math.h> 
<math.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<math.h> 
<stdio.h> 
<time.h> 
«time.h- 
<math.h> 
<math.h> 
<math.h> 
<time.h> 
<time.h> 
<stdlib.h> 
<stdlib.h> 
<errno.h> 
<stdlib.h> 
<math.h> 
<math.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 


HRB 名 
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文件 所 在 页 
signal.h 200 
signal.h 200 
stdio.h 276 
limits.h 76 
limits.h 76 
limits.h 76 
limits.h 76 
abort.c 379 
abs.c 355 
acos.c 155 
math.h 138 
asctime.c 437 
asin.c 155 
math.h 138 
assert.h 20 
atan.c 156 
atan2.c 157 
atexit.c 379 
atof.c 362 
stdlib.h 354 
atoi.c 361 
stdlib.h 354 
atol.c 361 
stdlib.h 354 
bsearch.c 358 
calloc.c 375 
ceil.c 141 
clearerr.c 287 
clock.c 426 
time.h 424 
cos.c 152 
math.h 138 
cosh.c 162 
ctime.c 436 
difftime.c 426 
div.c 355 
stdlib.h 354 
errno.c 54 
exit.c 379 
exp.c 162 
fabs.c 140 
fclose.c 280 
feof.c 288 
ferror.c 288 
fflush.c 298 
fgetc.c 290 
fgetpos.c 289 
stdio.h 276 


EZ 
名 字 头 文件 文件 所 在 页 
fgets <stdio.h> fgets.c 293 
floor <math.h> floor.c 141 
fmod <math.h> fmod.c 148 
fopen <stdio.h> fopen.c 279 
fpos t <stdio.h> stdio.h 276 
fprintf «stdio.h» fprintf.c 301 
fputc <stdio.h> fputc.c 296 
fputs - <stdio.h> fputs.c 300 
fread <stdio.h> fread.c 292 
free <stdlib.h> free.c 376 
freopen <stdio.h> freopen.c 280 
frexp <math.h> frexp.c 143 
fscanf <stdio.h> fscanf.c 318 
fseek <stdio.h> fseek.c 289 
"u <stdio.h> stdio.h 276 
fsetpos <stdio.h> fsetpos.c 290 
"om <stdio.h> stdio.h 276 
ftell «stdio.h» ftell.c 290 
"on «stdio.h» stdio.h 276 
fwrite «stdio.h» fwrite.c 299 
getc <stdio.h> getc.c 290 
NM «stdio.h» stdio.h 276 
getchar «stdio.h» getchar.c 291 
"onu «stdio.h» stdio.h 276 
getenv «stdlib.h» getenv.c 380 
gets «stdio.h» gets.c 294 
gmtime «time.h» gmtime.c 427 
isalnum «ctype.h» ctype.h 37 
LU <ctype.h> isalnum.c 37 
isalpha <ctype.h> ctype.h 37 
"on «ctype.h» isalpha.c 38 
iscntrl «ctype.h» ctype.h 37 
"ow «ctype.h» iscntrl.c 38 
isdigit «ctype.h» ctype.h 37 
won «ctype.h» isdigit.c 38 
isgraph «ctype.h» ctype.h 37 
” <ctype.h> isgraph.c 38 
islower <ctype.h> ctype.h 37 
ton «ctype.h» islower.c 38 
isprint «ctype.h» ctype.h 37 
"on <ctype.h> isprint.c 38 
ispunct <ctype.h> ctype .h 37 
"on <ctype.h> ispunct.c 39 
isspace <ctype.h> ctype.h 37 
"ow <ctype.h> isspace.c 39 
isupper <ctype.h> ctype.h 37 


mon «ctype.h» isupper.c 39 


名 字 
isxdigit 
jmp buf 
labs 

ldexp 

ldiv 
ldiv t 
localeconv 


"ou 


localtime 


log10 
longjmp 
malloc 
mblen 
mbstowcs 
mbtowc 
memchr 
memcmp 
memcpy 
memmove 
memset 
mktime 
modf 
offsetof 
perror 
pow 
printf 
ptrdiff t 
putc 


"om 


putchar 
nou 
puts 
qsort 
raise 
rand 
realloc 
remove 
rename 
rewind 
Scanf 
setbuf 


头 文件 
<ctype.h> 
<ctype.h> 
<setjmp.h> 
<stdlib.h> 
<math.h> 
«stdlib.h» 
<stdlib.h> 
<locale.h> 
<locale.h> 
<time.h> 
<math.h> 
<math.h> 
<math.h> 
<math.h> 
<setjmp.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<string.h> 
<string.h> 
<string.h> 
<string.h> 
<string.h> 
<time.h> 
<math.h> 
<stddef.h> 
<stdio.h> 
<math.h> 
<stdio.h> 
«stddef.h» 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdlib.h> 
<signal.h> 
<stdlib.h> 
<stdlib.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
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文件 所 在 页 
ctype.h 37 
isxdigit.c 39 
setjmp.h 187 
labs.c 356 
ldexp.c 144 
ldiv.c 356 
stdlib.h 354 
localeco.c 97 
locale.h .96 
localtim.c 433 
log.c 166 
math.h 138 
log10.c 167 
math.h 138 
longjmp.c 189 
malloc.c 374 
mblen.c 366 
stdlib.h 354 
mbstowcs.c 366 
mbtowc.c 366 
stdlib.h 354 
memchr.c 399 
memcmp.c 399 
memcpy.c 400 
memmove.c 400 
memset.c 400 
mktime.c 436 
modf.c 143 
Stddef.h 223 
perror.c 298 
pow.c 168 
printf.c 301 
stddef.h 223 
putc.c 297 
stdio.h 276 
putchar.c 297 
stdio.h 276 
puts.c 300 
qsort.c 356 
raise.c 202 
rand.c 359 
realloc.c 377 
remove.c 283 
rename.c 283 
rewind.c 290 
scanf.c 319 
setbuf.c 288 


456 附录 B 名 F 
名 字 头 文件 文件 所 在 页 
setjmp <setjmp.h> setjmp.c 188 
"on <setjmp.h> setjmp.h 187 
setlocale <locale.h> setlocal.c 102 
setvbuf «stdio.h» Setvbuf.c 289 
Sig atomic t <signal.h> signal.h 200 
signal «signal.h» signal.c 203 
sin <math.h> math.h 138 
nom <math.h> sin.c 152 
sinh «math.h» sinh.c 163 
size t «stddef.h» stddef.h 223 
"o" «stdio.h» stdio.h 276 
"o <stdlib.h> stdlib.h 354 
"u <string.h> string.h 398 
"on «time.h» time.h 424 
sprintf «stdio.h» sprintf.c 302 
sart <math.h> sqrt.c 159 
srand <stdlib.h> srand.c 359 
"on" «stdlib.h» stdlib.h 354 
sscanf «stdio.h» sscanf.c 319 
stderr «stdio.h» stdio.h 276 
stdin «stdio.h» stdio.h 276 
stdout «stdio.h» stdio.h 276 
streat <string.h> strcat.c 402 
strchr «string.h» strchr.c 403 
strcmp «string.h» strcmp.c 402 
strcoll «string.h» strcoll.c 410 
strcpy «string.h» strcpy.c 402 
strcspn «string.h» strcspn.c 403 
strerror «string.h» strerror.c 406 
"on «string.h» string.h 398 
strftime <time.h> strftime.c 436 
strlen <string.h> strlen.c 403 
strncat <string.h> strncat.c 401 
strncmp <string.h> strncmp.c 401 
strncpy «string.h» strncpy.c 402 
strpbrk «string.h» strpbrk.c 404 
strrchr «string.h» strrchr.c 404 
strspn <string.h> strspn.c 404 
strstr <string.h> Strstr.c 405 
strtod <stdlib.h> stdlib.h 354 
"on «stdlib.h» strtod.c 362 
strtok <string.h> strtok.c 405 
strtol <stdlib.h> strtol.c 362 
strtoul «stdlib.h» stdlib.h 354 
"om <stdlib.h> strtoul.c 361 
strxfrm <string.h> strxfrm.c 408 
system <stdlib.h> System.c 380 
tan «math.h» tan.c 153 


名 字 
tanh 
time 
time t 
tmpfile 
tmpnam 
tolower 


"on 


toupper 
ungetc 
va arg 
va end 
va list 
va start 
vfprintf 
vprintf 
vsprintf 
wchar t 
wcstombs 
wctomb 
_ADNBND 
_AUPBND 
_Aldata 
_Asin 
_Assert 
_Atan 
_BB 


DO 
_DBIAS 
_DI 
_DLONG 
_DOFF 
_Daysto 
 Dbl 
.Dconst 
_Defloc 
_Dint 


头 文件 
<math.h> 
<time.h> 
«time.h» 
<stdio.h> 
<stdio.h> 
<ctype.h> 
<ctype.h> 
«ctype.h» 
<ctype.h> 
<stdio.h> 
<stdarg.h> 
<stdarg.h> 
<stdarg.h> 
<stdarg.h> 
<stdio.h> 
<stdio.h> 
<stdio.h> 
xstddef.h» 
«stdlib.h» 
«stdlib.h» 
«stdlib.h» 
«stdlib.h» 
«yvals.h» 
<yvals.h> 
"xalloc.h" 
<math.h> 
«assert.h» 
"xmath.h" 
«ctype.h» 
«stdarg.h» 
<yvals.h> 
<ctype.h> 
<yvals.h> 
<yvals.h> 
<ctype.h> 
<stålib.h> 
"xstate.h" 
<ctype.h> 
<yvals.h> 
<yvals.h> 


'"«ctype.h» 


<yvals.h> 
<yvals.h> 
<time.h> 
xfloat.h» 
«math.h» 
"xlocale.h" 
"xmath.h" 
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文件 所 在 页 
tanh.c 155 
time.c 426 
time.h 424 
tmpfile.c 287 
tmpnam.c 284 
ctype.h 37 
tolower.c 39 
ctype.h 37 
toupper.c 39 
ungetc.c 291 
stdarg.h 211 
stdarg.h 211 
stdarg.h 211 
stdarg.h 211 
vfprintf.c 302 
vprintf.c 302 
vsprintf.c 303 
stddef.h 223 
stdlib.h 354 
wcstombs.c 369 
stdlib.h 354 
wctomb.c 369 
yvals.h 450 
yvals.h 450 
malloc.c 374 
xasin.c 154 
xassert.c 21 
xatan.c 158 
ctype.h 37 
stdarg.h 211 
yvals.h 450 
ctype.h 37 
yvals.h 450 
yvals.h 450 
ctype.h 37 
stdlib.h 354 
xstate.c 107 
xctype.c 42 
yvals.h 450 
yvals.h 450 
ctype.h 37 
yvals.h 450 
yvals.h 450 
xttotm.c 428 
xfloat.c 68 
math.h 138 
xdefloc.c 105 
xdint.c 142 


附录 B 名 F 

名 字 头 文件 文件 所 在 页 
_Dnorm "xmath.h" xdnorm.c 147 
.Dscale "xmath.h" xdscale.c 146 
 Dtento "xmath.h" xdtento.c 174 
_Dtest "xmath.h" xdtest.c 140 
_Dunscale "xmath.h" xdunscal.c 144 
_Dvals <float.h> float.h 66 
. EDOM <yvals.h> yvals.h 450 
_EFPOS «yvals.h» yvals.h 450 
. BRANGE <yvals.h> yvals.h 450 
_ERRMAX <yvals.h> yvals.h 450 
. ERRNO «errno.h» errno.h 53 
. Exp "xmath.h" xexp.c 160 
_FBIAS <yvals.h> yvals.h 450 
FLOAT <float.h> float.h 66 
. FNAMAX <yvals.h> yvals.h 450 
_FOFF <yvals.h> yvals.h 450 
_FOPMAX <yvals.h> yvals.h 450 
_FRND <yvals.h> yvals.h 450 
_Fgpos <stdio.h> xfgpos.c 285 
_Files <stdio.h> xfiles.c 279 
Flt <float.h> xfloat.c 68 
.Fmtval xfmtval.c 92 

.Fopen "xstdio.h" xfopen.c 284 
.Foprep "xstdio.h" xfoprep.c 281 
_Freeloc "xlocale.h" xfreeloc.c 118 
_Frprep "xstdio.h" xfrprep.c 295 
_Fspos <stdio.h> xfspos.c 286 
_Fwprep "xstdio.h" xfwprep.c 297 
_Genld "xstdio.h" xgenld.c 316 
_Gentime "xtime.h" xgentime.c 440 
_Getdst "xtime.h" xgetdst.c 432 
 Getfld "xstdio.h" xgetfld.c 324 
 Getfloat "xstdio.h" xgetfloa.c 328 
_Getint "xstdio.h" xgetint.c 326 
_Getloc "xlocale.h" xgetloc.c 104 
. Getmem "xalloc.h" xgetmem.c 375 
_Gettime "xtime.h" xgettime.c 434 
_Getzone "xtime.h" xgetzone.c 435 
_Hugeval <math.h> xvalues.c 139 
_ILONG <yvals.h> yvals.h 450 
_IOFBF <stdio.h> stdio.h 276 
 IOLBF <stdio.h> stdio.h 276 
_IONBF <stdio.h> stdio.h 276 
Inf "xmath.h" xvalues.c 139 
_Isdst "xtime.h" xisdst.c 431 
_LBIAS <yvals.h> yvals.h 450 
_LIMITS <limits.h> limits.h 76 


LO <ctype.h> ctype.h 37 
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名 字 
_LOCALE 
_LOFF 
_Ldbl 
_Ldtob 
 Ldunscale 
_Litob 
_Loctab 
_Locterm 
_Locvar 
_Log 
_MATH 
_MBMAX 
_MEMBND 
_Makeloc 
. Mbcurmax 
_Mbsave 
_Mbstate 
.Mbtowc 
_Mbxlen 
_Mbxtowc 
_NATS 
_NCAT 
_NERR 
 NSETJMP 
_NSIG 
_NULL 
_Nan 

PU 

Poly 
 Printf 
.Ptrdifft 
.Putfid 
.Randseed 
_Readloc 
_Rteps 
 SETJMP 
_SIGABRT 
. SIGMAX 
SIGNAL 
_SIZET 
_SIZET 
_SIZET 
_SIZET 
_SIZET 
SP 
_STDARG 
_STDDEF 
_STDIO 


头 文件 
<locale.h> 
<yvals.h> 
<float.h> 
"xstdio.h" 
"xmath.h" 
"xstdio.h" 


"xlocale.h" 
"xlocale.h" 
"xlocale.h" 
<math.h> 
<math.h> 
<yvals.h> 
<yvals.h> 
"xlocale.h" 
<stdlib.h> 
<stdlib.h> 
"xstate.h" 
«stdlib.h» 
<stdlib.h> 
<stdlib.h> 
<stdlib.h> 
<locale.h> 
<errno.h> 
<yvals.h> 
<signal.h> 
<yvals.h> 
"xmath.h" 
<ctype.h> 
"xmath.h" 
"xstdio.h" 
<yvals.h> 
"xstdio.h" 
<stdlib.h> 
"xlocale.h" 
"xmath.h" 
«setjmp.h» 
<yvals.h> 
<yvals.h> 
<signal.h> 
<xstddef.h> 
<stdio.h> 
<stdlib.h> 
<string.h> 
<time.h> 
<ctype.h> 
<stdarg.h> 
«stddef.h» 
<stdio.h> 


文件 
locale.h 
yvals.h 
xfloat.c 
xldtob.c 
xldunsca.c 
xlitob.c 
xloctab.c 
xiocterm.c 
xlocterm.c 
xlog.c 
math.h 
yvals.h 
yvals.h 
xmakeloc.c 
xstate.c 
stdlib.h 
xstate.c 
xmbtowc.c 
mblen.c 
mbtowc.c 
stdlib.h 
locale.h 
errno.h 
yvals.h 
signal.h 
yvals.h 
xvalues.c 
ctype.h 
xpoly.c 
xprintf.c 
yvals.h 
xputfld.c 
rand.c 
xreadloc.c 
xvalues.c 
setjmp.h 
yvals.h 
yvals.h 
signal.h 
stddef.h 
stdio.h 
stdlib.h 
string.h 
time.h 
ctype.h 
stdarg.h 
stddef.h 
stdio.h 
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名 字 头 文件 
 STDLIB <stdlib.h> 
STR <assert.h> 
STRING <string.h> 
_Scanf "xstdio.h" 
_Setloc "xlocale.h" 
_Sigfun «signal.h» 
.Sin «math.h» 
_Sizet <yvals.h> 
Skip "xlocale.h" 
Stod <stdlib.h> 
_Stoul <stdlib.h> 
_Strerror <string.h> 
_Strftime "xtime.h" 
_Strxfrm "xstrxfrm.h" 

T _TBIAS <yvals.h> 
TIME <time.h> 
_TNAMAX <yvals.h> 
Times "xtinfo.h" 
_Tinfo "xtinfo.h" 
_Tolower <ctype.h> 
_Toupper <ctype.h> 
_Ttotm <time.h> 
_Tzoff <time.h> 
_UP <ctype .h> 
—VAL «assert.h» 
.WCHART «stddef.h» 
_WCHART <stdlib.h> 
 Wchart <yvals.h> 
 Wcstate "xstate.h” 
_wetomb <stdlib.h> 
_Wextomb <stdlib.h> 
-XA <ctype.h> 
XD <ctype.h> 
XS <ctype.h> 
_Xbig "xmath.h" 

YVALS «yvals.h» 


文件 
stdlib.h 
assert.h 
string.h 
xscanf.c 
xsetloc.c 
signal.h 
xsin.c 
yvals.h 
xgetloc.c 
xstod.c 
xstoul.c 
strerror.c 
xstrftim.c 
xstrxfrm.c 
yvals.h 
time.h 
yvals.h 
asctime.c 
xtinfo.h 
xtolower.c 
xtoupper.c 
xttotm.c 
localtim.c 
ctype.h 
assert.h 
stddef.h 
stdlib.h 
yvals.h 
xstate.c 
xwctomb.c 
wctomb.c 
ctype.h 
ctype.h 
ctype.h 
xvalues.c 
yvals.h 


所 在 页 


354 

20 
398 
320 
106 
200 
150 
450 
104 
364 
360 
406 
439 
409 
450 
424 
450 
437 
100 

40 

41 
428 
433 

37 

20 
223 
354 
450 
107 
370 
369 

37 

37 

37 
139 
450 
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这 个 附录 列 出 了 那些 在 本 书 中 有 特殊 含义 的 术语 。 如 果 你 怀疑 一 个 术语 
的 含义 可 以 到 这 里 查看 。 
access 《访问 ) 一 一 获得 存储 在 一 个 数据 对 象 中 的 值 或 者 在 这 个 数据 对 象 中 
存储 一 个 新 值 。 
address constant expression 〈 地 址 常量 表达 式 ) 
类 型 的 静态 数据 对 象 的 表达 式 。 
allocated storage〈 可 控 的 存储 空间 ) 一 一 在 程序 运行 时 获得 存储 空间 的 数据 
HÆ. 
alphabetic character (字母 字符 ) 个 小 写 或 大 写字 母 。 
alphanumeric character〈 字 母 数 字 字符 ) 一 一 一 个 字母 字符 或 数字 。 
American National Standards Institute (ANSI) 一 一 美国 国家 标准 协会 ， 在 美 
国 被 授权 制定 计算 机 相关 标准 的 组 织 。 
argument (ZG) 一 一 在 一 个 函数 调用 中 为 某 个 形 参 提供 初始 值 的 表达 式 。 
argument-level declaration 〈 参 数 级 声明 ) 一 一 在 函数 定义 或 者 函数 原型 中 对 
某 个 参数 进行 的 声明 。 
arithmetic type〈 算 术 类 型 ) 一 一 整 型 或 者 浮 点 类 型 。 
array type〈 数 组 类 型 ) 一 一 由 某 些 预先 指定 的 重复 的 数据 对 象 元 素 组 成 的 数 
据 对 象 类 型 。 
American Standard Code for Information Interchange (ASCII) 一 一 美国 标准 信 
息 交 换 码 ， 标 准 字符 集 ISO 646 的 美国 版 本 。 
assembly language (汇编 语言 ) 一 一 适用 于 特定 计算 机 体系 结构 的 程序 设计 
语言 。 
assertion (Br). 一 一 对 正确 的 程序 一 定 为 真 的 谓词 。 
assign (WE) 一 一 在 一 个 数据 对 象 中 存储 一 个 值 。 
assigning operator 〈 赋 值 操 作 符 ) 一 一 把 一 个 值 存储 在 一 个 数据 对 象 中 的 操作 


可 以 用 来 初始 化 某 个 指针 
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符 ， 例 如 =、+= mE. 

assignment-compatible types ERR) 一 一 在 一 个 赋值 操作 符 的 两 边 
都 有 效 的 两 种 数据 类 型 。 

asynchronous signal (异步 信和 号) 一 一 和 程序 执行 没有 关联 的 重要 事件 ， 例 如 
一 个 提示 键 被 按 下 。 

atomic (R FIRE) 一 一 使 两 个 线程 同步 的 一 个 不 可 分 割 的 操作 。 

base (HRO 一 一 在 某 个 位 置 的 数字 表示 中 表示 某 个 数字 的 权 的 值 ， 例 如 以 
8 为 基数 (8 进 制 ) 或 以 10 为 基数 (10 进 制 )。 

basic C character set (基本 C 字符 集 ) 表示 一 个 C 源 文件 需要 的 最 小 的 
字符 编码 集合 。 

beginning-offle〈 文 件 开 始 ) 一 一 一 个 文件 中 第 一 个 字 节 之 前 的 文件 位 置 。 
benign redefinition (REBEX) 一 一 定义 一 个 已 经 存在 的 宏 的 宏 定义 ， 这 
两 个 定义 有 相同 的 符号 序列 ， 两 对 符号 之 间 有 空白 。 

bias (A£) 一 一 在 浮 点 表示 中 ， 加 到 一 个 指数 上 以 产生 特征 值 的 值 。 

binary 二进制 ) 一 一 和 文本 相对 ， 可 以 包含 任意 样式 的 位 组 合 。 

binary stream 《二 进 制 流 ) 可 以 包含 任意 的 二 进 制 数据 的 流 。 

block (8) —— C 函数 中 用 一 对 大 括号 括 起 来 的 一 组 语句 。 

block-level declaration 〈 块 级 别 声 明 ) 一 一 块 内 声明 。 

buffer〈 缓 冲 区 ) 一 一 用 作 方 便 的 工作 区 或 临时 存储 空间 的 数组 数据 对 象 ， 经 
常用 于 一 个 程序 和 一 个 文件 之 间 。 

C Standard (C 标准 ) —— ANSI 和 ISO 采用 的 C 程序 设计 语言 描述 ， 用 来 
使 C 实现 和 程序 之 间 的 差别 最 小 。 

call tree〈 调 用 树 ) 一 一 说 明 程序 内 部 的 一 组 图 数 之 间 相 互 调用 关系 的 层次 
*. 

calling environment GARE) 一 一 保留 在 栈 帧 中 代表 调用 函数 的 信息 。 
category 《类别 ) 一 一 区 域 设置 的 一 部 分 ， 用 来 处 理 某 组 服务 ， 例 如 字符 分 类 
或 者 时 间 和 日 期 格式 。 

character (PH) 一 一 C 中 占据 一 个 字 节 的 存储 空间 的 数据 类 型 ， 可 以 表示 
基本 C 字符 集中 的 所 有 编码 。 

character class (FFX) 一 一 相关 字符 编码 的 集合 ， 例 如 数字 、 大 写字 符 或 
标点 符号 。 

character constant (字符 常量 ) 一 一 C 程序 中 的 一 个 记号 ， 例 如 'a'， 它 的 整 
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数值 是 执行 字符 集中 某 个 字符 的 编码 。 

characteristic (HEE) 一 一 浮 点 表示 的 一 部 分 ， 用 来 存储 指数 的 偏 移 量 。 
close (关闭 ) 一 一 终止 流 和 文件 之 间 的 连接 。 

code 代码 ) 一 一 对 程序 设计 语言 文本 或 者 从 文本 产生 的 可 执行 文件 的 通 份 
叫 法 。 

collate CEFE) 一 一 按照 某 种 规则 确定 两 个 串 的 顺序 。 

compiler (HFR) 一 一 生成 一 个 可 执行 文件 的 翻译 器 。 

computer architecture (计算 机 体系 结构 ) 可 以 执行 常用 的 可 执行 文件 格 
式 的 一 类 计算 机 。 

constant type (HEXA) 一 一 初始 化 后 值 不 能 改变 的 数据 对 象 类 型 ， 因 为 具 
有 const 类 型 修饰 符 。 

control character GERPE) 一 一 执行 空格 或 者 其 他 控制 功能 的 字符 ， 不 在 
显示 设备 上 显示 图 像 。 

conversion specification 《转换 说 明 ) 在 打印 或 者 扫描 格式 中 以 一 个 百 分 
号 开始 的 字符 序列 ， 它 指定 了 下 一 次 执行 的 转换 或 者 传输 。 

conversion specifier (转换 说 阴 符 ) 一 一 转换 说 明 中 的 最 后 一 个 字符 ， 确 定 要 
执行 的 转换 或 者 传输 的 类 型 。 

converting type (转换 类 型 ) 一 一 修改 一 个 某 种 类 型 的 值 的 表示 方法 ， 使 它 可 
以 表示 为 另 一 种 类 型 的 值 。 

cross compiler (Z RAZR) 一 一 在 一 种 计算 机 体系 结构 下 执行 ， 且 能 生成 
可 以 在 男 一 种 计算 机 体系 结构 下 使 用 的 可 执行 文件 的 编译 器 。 

currency symbol (货币 符号 ) 一 一 用 来 显示 以 标识 一 种 货币 其 的 字符 序列 ， 
例如 $。 

data object (HEW R) 一 一 内 存 中 可 以 存储 指定 类 型 值 的 一 组 连续 的 字 节 。 
data object type〈 数 据 对 象 类 型 ) 一 一 和 函数 类 型 相对 ， 描 述 数据 对 象 的 类 
型 。 

Daylight Savings Time 〈 夏 令 时 ) 一 一 日 历年 中 的 某 段 时 间 ， 在 这 段 时 间 内 ， 
本 地 时 区 相对 UTC (协调 世界 时 ) 向 东 移 一 个 小 时 。 

decimal (HRD 一 一 以 10 为 基数 的 数字 表示 。 

decimal point 《小 数 点 ) 小 数 中 分 隔 整 数 部 分 和 小 数 部 分 的 字符 。 
declaration (AR) 一 一 C 程序 中 的 一 个 记号 序列 ， 用 来 命名 一 个 名 字 、 为 
一 个 数据 对 象 分 配 空 间 、 定 义 一 个 数据 对 象 的 初始 值 、 定 义 一 个 丽 数 的 行为 
和 /或 指定 一 种 类 型 。 
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default (RUO 一 一 当 要 求 作出 选择 而 没有 指定 任何 选择 时 的 选择 。 
definition (ÆX) 一 一 为 一 个 数据 对 象 分 配 空 间 的 声明 、 指 定 一 个 函数 行为 
的 声明 、 命 名 一 种 类 型 的 声明 或 者 对 宏 的 define 指示 。 

device handler〈 设 备 处 理 器 ) 一 一 操作 系统 的 一 部 分 ， 用 于 控制 某 个 VO E 
备 的 操作 。 

diagnostic (GEM) — C 翻译 器 发 出 的 报告 一 个 无 效 程序 的 消息 。 

digit HF) 一 一 用 来 表示 数 的 10 个 字符 中 的 一 个 ， 例 如 3. 

domain error CE X eO. 一 一 用 一 个 (或 多 个 ) TESTE (或 者 值 ) 调用 一 
个 数学 丽 数 ， 对 这 个 值 来 说 这 个 函数 没有 定义 。 

dot CR) 一 一 字符 .， 经 常用 作 小 数 点 。 

dynamic storage〈 动 态 存储 空间 ) 一 一 在 进入 一 个 块 《〈 或 者 函数 ) 时 分 配 存 
储 空间 ， 块 的 活动 终止 时 又 把 存储 空间 释放 掉 的 数据 对 象 ， 例 如 函数 形 参 、 
auto 声明 和 register 声明 。 


Extended Binary-Coded Decimal Interchange Code (EBCDIC) 一 一 扩展 的 二 
进 制 编码 的 十 进 制 交换 码 ，IBM 广泛 使 用 的 字符 编码 ， 特 别 是 在 System/370 
下 。 

element (WR) 一 一 数组 数据 对 象 重复 的 组 成 部 分 中 的 一 个 。 

end-of-file (XHAR) 一 一 文件 中 最 后 一 个 字 节 后 面 的 文件 位 置 。 

end-of-file indicator《 文 件 结束 符 ) 一 一 FILE 数据 对 象 的 一 个 成 员 ， 记 录 上 
一 次 读 操 作 是 否 遇 到 了 文件 结束 位 置 。 

environment 〈 环 境 ) 一 一 操作 系统 提供 的 C 程序 之 外 的 那些 服务 ， 对 C 程序 
可 见 ， 例 如 文件 和 环境 变量 。 

environment variable 〈 环 境 变量 ) 能 通过 环境 和 一 个 串联 系 在 一 起 的 名 字 。 
error indicator 〈 错 误 指 示 符 ) — FILE 数据 对 象 的 一 个 成 员 ， 记 录 上 一 次 操 
作 是 否 发 生 了 错误 。 

exception (异常 ) 一 一 在 程序 执行 过 程 中 发 生 的 要 求 特殊 处 理 的 情况 ， 例 如 
FER P tit » 

executable file (可 执行 文件 ) 一 一 不 需要 进一步 翻译 或 者 解释 ， 操 作 系统 就 
可 以 直接 运行 的 文件 。 

execution character set〈 执 行 字符 集 ) 一 一 程序 执行 时 使 用 的 字符 集 。 
exponent (指数 ) 一 一 浮 点 值 的 一 个 组 成 部 分 ， 指 定 了 底数 的 寡 。 

expression (AR) C 程序 中 连续 的 记号 序列 ， 指 定 了 怎样 计算 某 个 值 
和 产生 副作用 。 
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file (文件 ) 一 一 有 一 个 文件 名 的 连续 的 字 节 序列 ， 由 环境 维护 。 


file descriptor《 文 件 描述 符 ) 一 一 一 个 非 负 整数 ， 指 定 一 个 由 C 程序 打开 的 
一 个 文件 。 


file-level 《文件 级 别 ) —— C 源 文 件 中 所 有 声明 之 外 的 部 分 。 


file-position indicator (XFER) 一 一 和 一 个 打开 的 文件 相关 联 的 编码 值 ， 
指定 了 文件 中 下 一 个 要 读 或 者 写 的 字 节 。 


file-positioning error〈 文 件 定位 错误 ) 一 一 一 个 不 能 完成 的 改变 文件 定位 符 的 
file-positioning function 文件 定位 函数 ) 一 一 那些 读 取 或 者 修改 文件 定位 符 
的 函数 。 

file name 《文件 名 ) — C 标准 库 中 某 些 函数 用 来 指示 一 个 文件 的 名 字 。 
finite-state machine〈 有 限 状态 机 ) 一 一 行为 由 一 个 状态 值 和 一 些 谓词 决定 的 
计算 ， 例 如 一 个 输入 值 是 否 和 某 些 指 定 的 值 匹配 。 

floating-point type“ 浮 点 类 型 ) float, double 或 者 long double 中 的 任意 
一 种 。 

format (MX) AEG RER. 用 来 确定 打印 、 扫 描 或 者 时 间 
函数 的 行为 。 

formatted input 《格式 化 输入 ) 一 一 在 一 个 格式 的 控制 下 读 取 文本 并 把 它 转换 
为 编码 值 ， 就 像 扫描 函数 那样 。 


formatted output〈 格 式 化 输出 ) 一 一 在 一 个 格式 的 控制 下 转换 编码 值 并 把 它 
们 作为 文本 输出 ， 就 像 打印 函数 那样 。 


fraction (小 数 部 分 ) 一 一 浮 点 值 的 一 个 组 成 部 分 ， 按 照 确 定 的 精度 描述 区 间 
[1/base, I) 之 间 的 一 个 值 。 


free (释放) 一 一 释放 前 面 的 程序 执行 为 某 个 数据 对 象 分 配 的 存储 空间 。 
function (ÆR) 组 连续 的 可 执行 语句 ， 当 它 在 一 个 表达 式 内 调用 的 时 
候 ， 接 受 和 它 的 形 参 相对 应 的 实 参 值 ， 并 〈 可 能 ) 返回 供 那个 表达 式 使 用 的 
一 个 值 。 

function prototype (RRR) 一 一 包括 对 函数 形 参 的 强制 声明 的 函数 声明 。 
Greenwich Mean Time (GMT) 一 一 格林 尼 治 平时 ，UTC 的 旧称 。 

个 组 织 开 发 的 可 移植 C 编译 器 ， 这 个 组 织 的 软件 


”应 用 范围 很 广 。 


Ze 

handle (FÅR) 一 一 文件 描述 符 的 另 一 种 叫 法 。 

header file (HAXH 一 一 一 个 文本 文件 ， 通 过 在 C 源 文 件 中 被 #include fii 
处 理 指令 包含 而 成 为 翻译 单元 的 一 部 分 。 

heap CHE) 一 一 内 存 的 一 部 分 ， 可 执行 程序 可 以 使 用 它 存储 分 配 的 数据 对 象 。 
hexadecimal 〈 十 六 进 制 ) 一 一 以 16 为 基数 的 数字 表示 。 


hole (FB) 一 一 一 个 数据 对 象 或 者 参数 表 内 部 ， 对 确定 它们 的 值 不 起 作用 
一 组 连续 的 位 或 者 字 节 
identifier (标识 符 ) 一 一 一 个 名 字 。 


Institute of Electrical and Electronic Engineers (IEEE) 美国 电气 及 电子 工 
程 师 协会 ，ANSI 授权 的 开发 计算 机 相关 的 标准 的 组 织 之 一 


implementation (RW) 一 一 一 种 规范 说 明 的 可 工作 版 本 ， 例如 一 种 程序 设计 
语言 。 
include file (包含 文件 ) 一 一 一 个 文本 文件 ， 通 过 在 一 个 C 源 程序 或 者 男 一 


个 包含 文件 中 被 include 预 处 理 指令 包含 而 成 为 翻译 单元 的 一 部 分 。 


infinity (AFK?) 表示 一 个 值 太 大 了 而 不 能 被 有 穷 值 表示 的 一 个 浮 点 编 
码 。 


integer 


不 含 分 数 或 小 数 的 数 ， 可 能 为 负数 或 者 零 。 

integer constant expression 《整数 常量 表达 式 ) 一 一 翻译 器 翻译 的 时 候 可 以 将 
Donny "TC menner 

integer type (HI 示 某 些 连 续 的 整数 区 间 (包括 零 ) 的 数据 对 
象 类 型 。 

Intel 80X86 一 一 IBM PC 及 其 兼容 机 上 广泛 使 用 的 微 处 理 器 家 族 。 


Intel 80X87 一 一 支持 Intel 80X86 家 族 的 IEEE 754 浮 点 算术 标准 的 数学 协 处 
理 器 家 族 。 


interface (#20) —— C 程序 可 用 的 、 提 供 某 种 服务 〈 例 如 输入 /输出 ) BYR 
数 或 者 约定 的 集合 。 

international currency symbol (国际 货币 符号 ) 一 一 三 字母 编码 加 上 一 个 空格 
或 者 点 ， 指 定 世 界 上 某 种 货币 ， 由 ISO 4217:1987 指定 。 

interpreter (ÆRE) 一 一 程序 执行 过 程 中 仍 保持 控制 权 的 翻译 器 。 

invalid (无 效 的 ) 一 一 未 遵循 C 标准 。 

VO 一 一 输入 和 输出 。 
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ISO 一 一 国际 标准 化 组 织 ， 负 责 开发 国际 计算 机 相关 的 标准 的 组 织 。 

knock out (淘汰 ) 一 一 通过 为 一 个 具有 外 部 连接 的 名 字 提 供 一 个 定义 来 阻止 
链接 器 连接 一 个 库 目 标 模块 。 

letter PB). 一 一 英语 字母 表 中 a-z 和 A-Z 的 52 个 字母 之 一 ， 加 上 "cv 区 
域 疫 置 之 外 的 其 他 附加 字符 。 

librarian〈 库 管理 器 ) 一 一 维护 目标 模块 库 的 程序 。 

library (E). 一 一 目标 模块 的 集合 ， 链 接 器 可 以 有 选择 地 把 它 和 一 个 可 执行 
程序 连接 来 为 具有 外 部 连接 的 名 字 提 供 定义 。 

linker( 链 接 器 一 一 把 目标 模块 组 合 起 来 形成 可 执行 文件 的 程序 。 

locale (区域 设置 ) 一 一 修改 C 标准 库 的 行为 以 适应 某 个 具体 的 文化 或 者 职 
业 的 约定 的 信息 的 集合 。 

locale-specific〈 特 定 于 区 域 设 置 ) 的 一 一 因 区 域 设置 的 变化 而 变化 。 
lowercase letter〈 小 写字 母 ) 一 一 英语 字母 表 中 a~z 这 26 个 字母 中 的 一 个 ， 
还 可 能 会 加 上 "Cc" 区 域 设置 之 外 某 些 附加 的 字符 。 

Ivalue 〈 左 值 ) 指定 一 个 数据 对 象 的 表达 式 。 

machine 〈 机 器 ) 一 一 对 各 种 计算 机 体系 结构 的 通称 。 

macro (EO 一 一 由 #define 预 处 理 指 令 定义 的 一 个 名 字 ， 它 指定 了 翻译 单元 
中 宏 的 后 续 调 用 的 代替 文本 。 

macro definition (REX) 一 一 和 一 个 宏 名 关联 的 代替 文本 。 

macro guard CERI) 一 一 用 来 保证 一 个 文本 序列 在 一 个 翻译 单元 中 最 多 被 
连接 一 次 的 宏 名 。 

macro, masking GER) 一 一 屏 项 一 个 翻译 单元 前 面 声 明 的 相同 的 名 字 的 宏 
定义 。 

member (WA) 一 一 一 个 数据 对 象 声 明 ， 它 指定 了 一 个 结构 或 者 联合 声明 中 
的 其 中 一 个 组 成 部 分 。 

mode (FÅR) HE T DINER NT FT Ag BOMME, føl in TX 
件 的 文本 模式 和 二 进 制 模式 。 

modifiable lvalue (可 更 改 的 左 值 》 剖 定 一 个 可 以 在 其 中 存储 一 个 新 值 的 
数据 对 象 〈 既 不 是 常量 ， 也 不 是 数组 类 型 ) 的 表达 式 。 

monetary ($ MAJ) 与 货币 有 关 的 。 

Motorola MC680X0 一 一 Apple Macintosh 和 某 些 Sun 工作 站 下 常用 的 微 处 理 
SEA o 


468 


附录 C OR 语 


Motorola MC68881 一 一 支持 Motorola MC680X0 家 族 的 IEEE 754 浮 点 算术 
的 数学 协 处 理 器 家 族 。 

MS-DOS 一 一 微软 公司 为 PC 可 兼容 的 电脑 开发 的 流行 的 操作 系统 。 

multibyte character〈 多 字 节 字符 ) 一 一 大 字符 集中 的 一 个 字符 ， 通 常 编码 为 
一 个 或 者 多 个 常规 (单字 节 〉 字符 序列 。 

multithread (多 线程 一 一 在 一 个 给 定 的 时 间 间 隔 内 ， 支 持 多 个 程序 执行 ， 
可 能 还 允许 各 个 独立 程序 执行 之 间 的 交互 。 

name (AF) 一 一 在 一 个 翻译 单元 中 用 来 指定 不 同 的 实体 一 一 例如 函数 、 宏 
或 者 成 员 一 一 的 、 一 个 大 集合 中 的 一 个 记号 。 

name space (fø sig) 一 一 在 C 程序 内 部 通过 上 下 文 环境 可 区 分 的 名 字 集 


A 
He 


native (本 地 ) LIA mA RAAE. 

not-a-number 〈 非 数 ) 不 指定 任何 数字 值 的 浮 点 编码 ， 例 如 一 个 没有 定义 
的 结果 。 

null character (RFF) 一 一 编码 值 为 零 的 字符 。 

null pointer( 空 指针 ) 一 一 和 有 零 比较 时 相等 的 指针 类 型 值 ， 因 此 它 不 指向 任 
何 函 数 或 者 数据 对 象 。 

null-pointer constant〈 空 指针 常量 ) 一 一 一 个 整数 常量 表达 式 ， 例 如 0， 在 某 
些 上 下 文 环境 中 它 可 以 作为 空 指针 使 用 。 

object module ( ARRIR) 一 一 翻译 单元 翻译 后 的 形式 ， 适 合作 为 可 执行 程 
序 的 一 部 分 来 连接 。 

octal (八进制 ) 一 一 以 8 为 基数 的 数字 表示 。 

offset AREE) 一 一 数据 对 象 内 部 的 成 员 或 者 元 素 的 相对 地 址 ， 通 常 以 字 节 
为 单位 。 

one's-complement arithmetic (1 的 补 码 算术 ) 一 一 一 种 二 进 制 编码 形式 ， 这 
种 形式 下 ， 一 个 数 的 相反 数 是 它 的 按 位 取 反 。 

open GIF) 一 一 在 一 个 文件 和 一 个 流 之 间 建 立 联 系 。 

operand〈 操 作 数 ) 一 一 C 表达 式 中 的 子 表 大 式 ， 操 作 符 对 其 进行 操作 。 
operating system GRIERA) 一 一 一 个 运行 其 他 程序 的 程序 ， 通 常会 掩盖 那 
些 具 有 相同 体系 结构 的 计算 机 之 间 的 差别 。 

operator (EH) 一 一 C 表达 式 中 产生 一 个 给 定 类 型 值 的 记号 ， 并 且 可 能 
会 产生 副作用 ， 可 以 跟 一 个 到 3 个 子 表 达 式 作为 操作 数 。 
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overfiow (Eti). 一 一 一 个 太 大 而 不 能 表示 为 要 求 的 整 型 或 者 浮 点 类 型 的 值 “ 
的 计算 。 

parameter (W) 一 一 函数 中 声明 的 数据 对 象 ， 它 存储 函数 调用 时 对 应 的 实 
参 值 。 

parse (D) 一 一 确定 一 个 记号 序列 的 语法 结构 。 

PC 一 一 IBM 在 20 世纪 80 年 代 早 期 推出 的 计算 机 体系 结构 ， 它 已 经 变 成 了 
使 用 最 广泛 的 个 人 电脑 。 

PDP-1 
就 是 在 这 种 体系 结构 下 首次 开发 出 来 的 。 

period (AA) 一 一 点 字符 的 另 一 个 名 字 。 

Peripheral Interchange Program (PIP) 一 -一 外 设 交 换 程 序 ， 一 些 老 的 操作 系统 
使 用 它 转 换文 件 和 设备 格式 。 

pointer type〈 指 针 类 型 ) 
类 型 。 

portability 〈 可 移植 性 ) 一 一 移 到 另 一 个 环境 下 比 为 这 个 环境 重新 编写 代码 更 
经 济 。 

POSIX 一 一 IEEE 1003 标准 操作 系统 接口 ， 它 建立 在 UNIX 为 应 用 程序 提供 
的 系统 服务 的 基础 上 。 

precision Cf E 示 的 值 的 数目 ， 通 常用 位 或 十 进 制 数 字 表 
示 〔 它 们 指明 了 可 以 确切 表示 的 值 数 目的 对 数 )。 

predicate CAW) 一 一 产生 一 个 二 进 制 结果 的 表达 式 ， 通 常用 非 零 表示 真 ， 
零 表 示 假 。 

preprocessor 〈 预 处 理 器 ) 一 一 C 翻译 器 的 一 部 分 ， 处 理 面 向 文本 的 指令 和 宏 
调用 。 

primitive〈 原 语 ) 一 -一 执行 关键 服务 的 接口 函数 ， 经 常 是 那些 不 能 通过 其 他 
方式 实现 的 前 数 。 

print function〈 打 印 函 数 ) 一 一 在 格式 串 的 控制 下 把 编码 值 转换 为 文本 的 也 
数 。 

printable 《可 打印 的 ) 一 一 得 到 一 个 有 意义 的 结果 ， 例 如 当 写 出 到 显示 设备 
时 ， 显 示 一 个 图 形 或 者 控制 打印 位 置 。 

program《〈 程 序 ) 一 一 函数 和 数据 对 象 的 集合 ， 计 算 机 可 以 通过 执行 它 来 完成 
相应 的 C 源 文件 集 的 语义 目标 。 

program startup 〈 程 序 启动 ) 一 一 程序 执行 过 程 中 main 函数 调用 之 前 的 那 段 
时 间 。 


vår å 


表示 函数 或 者 数据 对 象 类 型 的 地 址 的 数据 对 象 
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program termination〈 程 序 终止 ) 一 一 程序 执行 过 程 中 main RAGE ALR 


用 exit 后 的 那 段 时 间 。 

push back (EHR) 一 一 把 一 个 字符 返回 给 输入 流 ， 这 样 它 就 是 下 一 个 要 读 取 
的 字符 。 

punctuation 《标点 符号 ) 一 一 字母 和 数字 之 外 的 可 打印 字符 ， 用 作 分 割 和 划 
定 字符 序列 。 


H range error (ERR) 一 一 用 一 个 〈 或 多 个 ) 实 参 值 调 用 一 个 数学 丽 数 ， 生 
成 的 结果 太 大 或 者 太 小 而 不 能 表示 为 一 个 有 穷 值 。 
read function EARO 一 一 从 一 个 流 中 获得 输入 的 函数 。 
read-only (RR) 一 一 包含 一 个 不 能 被 修改 的 存储 值 。 
recursion GAH) 一 一 在 一 个 函数 的 生存 期 中 调用 这 个 函数 。 
表示 一 种 数据 类 型 所 用 的 位 数 ， 以 及 描述 各 种 位 


representation (ÆR) 


模式 的 含义 。 
reserved name 〈 保 留 名 字 ) 一 一 只 能 用 作 某 种 特定 目的 的 名 字 。 
round ($A) 一 一 根据 某 种 规则 使 用 缩减 的 精度 来 获得 一 种 表示 ， 例 如 就 近 


BA. 
rvalue AC 一 一 指定 某 种 类 型 的 值 的 表达 式 〈 不 一 定 要 指定 一 个 数据 对 
象 )。 

S scan fonction〈 扫 描 函 数 ) 一 一 在 格式 串 的 控制 下 把 文本 转换 为 编码 值 的 函 
数 。 


scan set 《扫描 集 〉 一 一 扫描 函数 的 转换 说 明 符 ， 指 定 了 匹配 字符 的 集合 。 


seek (FB) 一 一 修改 一 个 流 的 文件 定位 符 来 指定 文件 内 的 一 个 给 定 的 字符 
位 置 。 

semantics (语义 ) 一 一 一 种 语言 中 某 个 有 效 的 记号 序列 的 含义 。 

sequence point 序列 点 ) 一 一 程序 的 某 个 地 方 ， 在 这 个 地 方 ， 存 储 数 据 对 象 
中 的 值 处 于 一 个 已 知 的 状态 。 


side effect《 副 作用) 一 一 执行 一 个 表达 式 时 ， 存 储 在 一 个 数据 对 象 中 的 值 或 
者 一 个 文件 的 状态 发 生 了 改变 。 


signal (£8 8). 一 一 在 程序 执行 过 程 中 要 求 得 到 立即 关注 的 事件 。 

signal handler (fÈ SAR EF) 一 一 发 生 一 个 信号 时 执行 的 程序 。 

signed integer (有 符号 整数 ) 一 一 可 以 表示 正 值 和 负 值 的 整数 类 型 。 
signed-magnitude arithmetic (有 符号 数值 算术 ) 一 一 一 种 二 进 制 编码 形式 ， 这 
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种 编码 形式 下 ， 一 个 数 的 相反 数 只 取 它 的 符号 位 的 补 。 

significance loss (GRUER) 一 一 浮 点 加 法 或 减法 中 由 于 高 位 缺失 导致 的 
有 效 精度 的 缩减 。 

source file〈 源 文件 ) 一 一 C 翻译 器 可 以 翻译 为 一 个 目标 模块 的 文本 文件 。 
space (空格 ) 一 一 占据 一 个 打印 位 置 但 不 显示 任何 图 形 的 字符 。 

stack (EO. 一 一 具有 后 进 先 出 原则 的 列表 。 

stack frame (Beli) 一 一 函数 被 调用 时 为 调用 栈 分 配 的 数据 。 

Standard C〈 标 准 C). 一 一 ANSIISO C 标准 定义 的 C 程序 设计 语言。 

Standard C library (C 标准 库 ) 一 一 C 标准 定义 的 、 可 以 被 任意 托管 C 程序 
使 用 的 函数 、 数 据 对 象 和 头 文 件 的 集合 。 

standard header〈 标 准 头 文件 ) ——— C 标准 定义 的 15 个 头 文 件 之 一 。 

state table (状态 表 ) 一 一 定义 了 一 个 有 穷 状 态 机 的 行为 的 数组 。 

statement CAJ) 一 一 苑 数 的 可 执行 的 组 成 部 分 ， 指 定 了 某 种 动作 ， 例 如 对 
一 个 表达 式 求 值 或 者 修改 控制 流 。 

static storage《〈 和 静态 存储 空间 ) 一 一 一 种 数据 对 象 ， 它 们 的 生存 周期 从 程序 启 
动 一 直到 程序 终止 ， 在 程序 启动 之 前 进行 初始 化 。 

store CF) 一 一 用 一 个 新 值 到 代 存 储 在 某 个 数据 对 象 中 的 值 。 

stream GE) 一 一 维护 一 个 打开 的 文件 的 一 系列 读 、 写 和 文件 定位 请 求 的 状 
态 的 数据 对 象 。 

string CR) 一 一 存储 在 一 个 数组 中 的 字符 序列 ， 这 个 数组 的 最 后 一 个 元 素 
(下 标 最 高 的 元 素 ) 是 一 个 空 字 符 。 

string literal (FHS) 一 一 C 源 文件 中 双 引 号 之 间 的 记号 ， 例 如 "abc" 
它 指定 一 个 初始 化 为 指定 字符 序列 末尾 再 加 上 一 个 空 字符 的 char 类 型 只 读数 
组 。 

structure type 结构 类 型 ) 一 一 由 不 同类 型 的 数据 对 象 成 员 组 成 的 数据 对 象 类 
型 。 

stub (FR) 一 一 也 数 的 低级 形式 ， 用 于 测试 或 者 作为 渔 数 正确 实现 之 前 的 
形式 。 

Sun UNIX 一 一 为 Sun 工作 站 提供 的 UNIX 操作 系统 的 一 个 版 本 。 

synchronous signal (同步 信号 ) 一 一 在 程序 执行 过 程 中 发 生 的 重要 事件 ， 例 
MK. 

synonym (Ri) 一 一 声明 一 种 类 型 的 男 一 种 方式 ， 不 过 它 等 价 于 原始 类 
型 。 
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syntax GER) 一 一 对 语言 中 有 效 的 记号 序列 的 语法 限制 。 
System/370 一 一 20 世纪 60 年 代 IBM 开发 的 一 种 至 今 仍 广泛 使 用 的 计算 机 体 
系 结构 ， 尤 其 适用 于 特别 大 的 应 用 程序 。 

system call (系统 调用 ) 一 一 系统 服务 的 另 一 个 叫 法 。 

system service〈 系 统 服务 ) 一 一 请 求 操作 系统 执行 某 种 服务 ， 例 如 向 一 个 设 
备 写 人 数据 或 者 获得 当前 时 间 。 

text (MAR) 一 一 适合 写 人 到 一 个 显示 设备 《可 以 被 人 们 识别 ) 的 字符 序列 。 
text stream (文本 流 ) 一 一 包含 文本 的 流 。 

thousands separator (FALSE) 一 一 用 来 对 小 数 点 左边 的 数 进行 分 组 的 字 
符 〈 不 一 定 是 3 个 字符 一 组 )。 

thread of control (控制 线程 ) 一 一 一 个 程序 实体 的 执行 。 

time zone〈 时 区 ) 一 一 地 球 上 的 一 个 区 域 ， 这 个 区 域 的 本 地 时 间 和 UTC AE 
定 的 差 值 。 

token (记号 ) 一 一 在 高 级 语法 中 可 以 作为 一 个 元 素 对 待 的 字符 序列 。 
translation table 〈 转 换 表 ) 指明 了 两 种 编码 方式 之 间 对 应 关系 的 数组 。 
translation unit (翻译 单元 ) 一 一 一 个 C 源 文件 加 上 include 指令 包含 的 所 
有 文件 ， 不 包括 条 件 编 译 语句 跳 过 的 源 文件 行 。 

translator (翻译 器 〉 一 一 将 翻译 单元 转换 成 可 执行 形式 的 程序 。 

truncate (截断 ) 向 零 舍 人 。 

Turbo C++ 一 一 Borland 公司 为 PC 兼容 机 开发 的 ANSI C《〈 和 更 新 的 语言 
C++) 实现 。 . 
two's-complement arithmetic (2 的 补 码 算术 ) 一 一 一 种 二 进 制 编码 方式 ， 这 
种 编码 方式 下 ， 一 个 数 的 相反 数 的 编码 是 按 位 取 反 加 一 。 

type〈 类 型 ) 一 一 一 个 值 的 属性 〈 确 定 它 的 表示 及 可 以 对 它 执行 什么 样 的 操 
作 ) 或 一 个 函数 的 属性 (确定 它 可 以 接受 什么 样 的 参数 及 有 什么 样 的 返回 
få). 

type definition 〈 类 型 定义 ) 一 一 对 某 种 类 型 进行 命名 的 声明 。 

underflow (Fi) 一 一 一 个 值 的 计算 结果 太 小 而 不 能 作为 指定 浮 点 类 型 表 
AN o 

union type (RRA RI) 一 一 由 可 选 的 多 种 数据 对 象 成 员 组 成 的 数据 对 象 ， 每 
次 只 能 表示 其 中 的 一 种 成 员 类 型 。 

UNIX——AT&T 贝尔 实验 室 在 20 世纪 70 年 代 开 发 的 一 个 独立 于 机 器 的 操作 
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系统 ，C 语言 的 第 一 个 宿主 环境 。 


unsafe macro〔 不 安全 的 宏 个 或 者 多 个 参数 进行 多 次 求 值 的 
E, Rcs TREE RIN AG 这 些 宏 可 能 产生 意 想 不 到 的 结 时。 
unsigned integer (无 符号 整数 ) 一 一 只 能 表示 零 和 某 个 正 数 上 限 之 间 的 值 的 
整数 类 型 。 

ULTRIX 一 一 由 DEC 封装 和 支持 的 适用 于 VAX BERE UNIX 版 本 。 


uppercase letter (大写 字母) 一 一 英语 字母 表 中 a-z 这 26 个 字母 中 的 一 个 ， 
还 可 能 加 上 "C" 区 域 设置 之 外 其 他 的 附加 字符 。 
Universal Time Coordinated (UTC) 一 一 协调 世界 时 ，GMT 的 现代 称呼 。 
variable ($E) 一 一 数据 对 象 的 旧称 。 
variable argument list 可 变 参数 表 ) 一 一 函数 的 参数 列表 ， 它 可 以 接受 声明 
的 最 后 参数 之 外 的 附加 参数 。 

VAX 一 一 继 DEC PDP-11 之 后 开发 的 DEC 计算 机 体系 结构 ，C 和 UNIX 仍然 
在 这 种 体系 结构 下 广泛 使 用 。 
void type (void 类 型 ) 一 一 没有 任何 表示 方法 和 值 的 类 型 。 
volatile type (volatile 类 型 ) 一 一 为 那些 可 能 被 多 个 控制 线程 访问 的 数据 对 象 
设计 的 限定 类 型 。 
WG14——1SO 授权 负责 C 标准 化 的 委员 会 


white-space (S EO 一 一 一 个 或 者 多 个 空格 字符 的 序列 ， 可 以 和 其 他 字符 ， 
例如 水 平 制 表 符 等 混合 。 


wide character《〈 宽 字 节 字符 ) 一 一 用 来 表示 大 字符 集 的 wchar t 类 型 的 编码 
få. 

width (BE) 一 一 格式 中 转换 说 明 的 一 部 分 ， 它 部 分 控制 要 传送 的 字符 数 。 
writable (APSA) 一 一 值 可 以 改变 ， 和 只 读 相 对 应 。 

write function (GM) 一 一 把 输出 传送 到 一 个 流 和 的 也 数 。 

X3J11 一 一 ANSI 授权 开发 原始 的 C 标准 的 委员 会 。 

zero fixup (CREE) 一 一 用 零 代 替 发 生 下 溢 的 浮 点 值 。 


“绝对 一 流 的 著作 ，C 程 序 员 的 区 八大 餐 ! ” 


一 一 C/C++ 用 户 协会 


本 书 是 由 世界 级 C 语 言 委 家 编写 的 C 标 准 库 经 典 著作 。 英 文 版 已 经 重印 十 多 次 ， 影 响 了 几 代 程序 员 。 

本 书 结合 C 标 准 的 相关 部 分 ， 精 辟 地 讲述 了 每 一 个 库 函 数 的 使 用 方法 和 实现 细节 ， 这 正 是 一 个 真正 的 C 程 序 
员 所 必须 掌握 的 。 更 重要 的 是 ， 书 中 给 出 了 实现 和 测试 这 些 函 数 的 完整 源 代码 ， 可 以 让 你 更 深入 地 学 习 C 语 言 。 
不 仅 如 此 ， 本 书 还 讨论 了 一 些 即使 是 最 有 经 验 的 C 程 序 员 通常 也 不 熟悉 的 知识 ， 比 如 国际 化 和 独立 于 区 域 设置 的 
程序 的 编写 、 与 构建 库 相 关 的 概念 和 设计 思想 。 


现任 ISO C++ 标 准 委员 会 主席 。 他 是 C/C++ 标准 库 开发 领域 的 大 师 ， 所 开发 的 Dinkumware 标 准 库 应 用 


| P. J. Plauger 世界 著名 的 软件 技术 专家 ， 曾 任 ISO C 标 准 委员 会 主席 ，C/C++ User's Journal EF, 
` ` 
P: 广泛。 
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